Главная
страница 1
Поволжский государственный университет телекоммуникаций и информатики

Кафедра информационных систем и технологий


Отчет по лабораторной работе №8
по дисциплине

«Информационно-поисковые системы»


Выполнил: Уксусов К.С. ИСТ-72

Проверил: Захаров С.В.


Выполнение работы:

Задание 1:

Используя системы Google, Fast (AlltheWeb), Teoma и MSN Search провести поиск по запросу «Корпусная лингвистика» на английском языке. Логическая формула: (corpus V corpora) & (linguistics V language). Скопировать скриншоты первых веб-страниц с результатами поиска (10 документов) в файл отчета.
Вывод: В ходе данной лабораторной работы был проведен поиск по заданному логическому предписанию в следующих ИПС: Google, Fast (AlltheWeb), Teoma и MSN Search. Был произведен анализ количественных результатов, сравнение документов в выдаче (первые 10), а также их анализ на релевантность. Следует отметить, что наибольшее количество документов по запросу было найдено в поисковой системе Teoma, однако по релевантности она показала наихудший результат. Наилучший же результат по релевантности документов показала ИПС Google. .

Google


Alltheweb




Teoma


MSN

Задание 2:

Составить в файле отчета таблицу с количественными результатами поиска.


 

Google

Alltheweb

Teoma

MSN Search

Количество результатов

543000

645000

68600

39800

Задание 3:

Проанализировать (попарно) совпадение документов в выдаче по каждой системе (10 документов):


 

Google

Fast

Teoma

MSN Search

Google

 

-

-

-

Fast

2

 

-

-

Teoma

7

1

 

-

MSN Search

2

10

1

 

Задание 4:

Выписать все совпавшие документы по следующей схеме:


  • документы, присутствующие в выдаче (в первой десятке) во всех четырех системах;

  • документы, присутствующие в выдаче (в первой десятке) в трех системах;

  • документы, присутствующие в выдаче (в первой десятке) в двух системах;

при этом каждый документ идентифицировать следующим образом: sN, где s - идентификатор системы (соответственно g, f, t или m), а N - ранг документа в данной системе. Таким образом, для документа, представленного в выдаче в трех системах, в файле отчета будет создана, скажем, такая запись: g3-f9-m2, что означает, что этот документ был найден в системах Google, Fast, и MSN Search и находится в выдаче этих систем соответственно на 3-м, 9-м и 2-м месте.


Название документа

Идентификатор документа

Corpus linguistics; and international handbook

t3-f5-m5-g3

Corpus linguistics-Wikipedia, the free encyclopedia

f1-m1-g1

Corpus Linguistics Bibliography

f2-m2

Задание 5:



Проанализировать релевантность первых 10 документов и оценить точность каждой системы. Результаты представить в виде таблицы.


№ п/п

Название системы

Количество релевантных документов

Точность*

Сумма рангов релевантных документов

1

Google

8

0,8

29

2

Teoma

6

0,6

19

3

Fast

5

0,5

34

4

MSN Search

5

0,5

36


Точность = (количество релевантных документов/количество найденных документов)*100%


Смотрите также:
Отчет по лабораторной работе №8 по дисциплине «Информационно-поисковые системы»
40.89kb.
1 стр.
Информационно-поисковые системы
169.54kb.
1 стр.
В. П. Захаров Информационно-поисковые системы Учебно-методическое пособие
779.02kb.
4 стр.
Отчет по лабораторной работе №4 по дисциплине «Операционные системы»
90.67kb.
1 стр.
Методические указания к лабораторной работе №1 «Изучение лабораторного комплекса sdk 1» по дисциплине «Микропроцессорные системы»
50.73kb.
1 стр.
Отчет по лабораторной работе №5 по дисциплине электроника
97.38kb.
1 стр.
Отчет по лабораторной работе №5 по дисциплине электроника
119.38kb.
1 стр.
Отчет по лабораторной работе №2 по курсу «Операционные системы»
38.12kb.
1 стр.
Специальность "прикладная математика" Методы ссылочного ранжирования в информационно-поисковых системах. Диплом
300.82kb.
2 стр.
Отчет по лабораторной работе №5 по дисциплине Методы оптимизации
69.77kb.
1 стр.
Курсовой проект по дисциплине: «Автоматизированные информационно-управляющие системы» на тему 1: «Управление коммутируемой сетью передачи информации (спи)»
798.94kb.
6 стр.
Отчет по лабораторной работе №3 по дисциплине «Сети ЭВМ и телекоммуникации»
187.36kb.
1 стр.