Средства поиска данных в Интернете
Для запросов используется
1.67M

Поиск данных в Интернете

1. Средства поиска данных в Интернете

2.

3.

Поиск информации в Интернете
осуществляется с помощью специальных
программ:
поисковые каталоги;
поисковые указатели.

4.

Поисковые каталоги устроены по тому же принципу,
что и тематические каталоги крупных библиотек.
Они обычно представляют собой иерархические
гипертекстовые меню с пунктами и подпунктами,
определяющими тематику сайтов, адреса которых
содержатся в данном каталоге, с постепенным, от
уровня к уровню, уточнением темы.
Основной проблемой поисковых каталогов является
чрезвычайно низкий коэффициент охвата ресурсов
WWW.

5.

Принцип работы поисковых указателей заключается в
создании и использовании индексных списков –
аналогов книжных предметных указателей.
Работу поискового указателя можно условно разделить
на три этапа:
◦ сбор первичной базы данных (используются специальные
агентские программы — черви);
◦ индексация базы данных — первичная обработка с целью
оптимизации поиска (создаются специализированные
документы — собственно поисковые указатели);
◦ рафинирование результирующего списка (создается список
ссылок, который будет передан пользователю в качестве
результирующего).
Фильтрация – отсев ссылок, которые нецелесообразно выдавать
пользователю (например, проверяется наличие дубликатов).
Ранжирование заключается в создании специального порядка
представления результирующего списка (по количеству ключевых
слов, сопутствующих слов и др.).

6. Для запросов используется

Символ | для обозначения логической
операции «Или»
Символ & для обозначения логической
операции «И»

7.

Решить задачи (с пояснениями):
Приведены запросы к поисковому серверу.
Расположите номера запросов в порядке
убывания количества страниц, которые найдет
поисковый сервер по каждому запросу.
1: 1) Модемы & факсы & продажа
2) Модемы & продажа
3) Модемы | продажа
4) Модемы | факсы | продажа

8.

Запишем запросы как логические выражения
с предикатами:

9.

Запишем запросы как логические выражения
с предикатами:
Отметим области на диаграмме:
Ответ – 1234

10.

Приведены запросы к поисковому серверу.
Расположите номера запросов в порядке
убывания количества страниц, которые найдет
поисковый сервер по каждому запросу.
2: 1) спорт & футбол & чемпионат
2) спорт | футбол & чемпионат
3) cпорт | футбол | чемпионат & 2006
4) спорт | футбол | чемпионат
3: 1) канарейки | щеглы | содержание
2) канарейки & содержание
3) канарейки & щеглы & содержание
4) разведение & содержание & канарейки &
щеглы

11.

4:
1) зайцы & кролики
2) зайцы & (кролики | лисицы)
3) зайцы & кролики & лисицы
4) кролики | лисицы
5:
1) шкафы | столы | стулья
2) шкафы
3) шкафы | столы
4) шкафы | (столы & стулья)
6:
1) Толстой & "Анна Каренина"
2) Толстой | Анна | Каренина
3) Толстой | Каренина
4) Толстой & Анна & Каренина

12.

Практическое задание по поиску
English     Русский Rules