Similar presentations:
Информационно-поисковая система. Современные алгоритмы работы с информацией
1.
ИНФОРМАЦИОННОПОИСКОВАЯ СИСТЕМА.СОВРЕМЕННЫЕ
АЛГОРИТМЫ РАБОТЫ
С ИНФОРМАЦИЕЙ.
2.
Назначение информационно-поисковойсистемы (ИПС)
ИПС предназначена для организации полнотекстового (с учетом морфологии языка)
и семантического (по смыслу) поиска документов в архивных фондах.
Функциональные возможности, предоставляемые Системой доступны для населения, органов
государственной власти, органов местного самоуправления и юридических лиц.
1.
Обеспечение
самостоятельного
доступа к документам
Общение с системой
на естественном языке
Поиск и предоставление
информации из различных
источников, с учетом ролевой
модели прав доступа
Расширение
спектра
электронных
услуг
Общение с системой
2.
3.
Сокращение
временных и
трудовых затрат
на естественном языке
Эффективные алгоритмы
индексирования материалов
Открытые интерфейсы
и протоколы взаимодействия с внешними информационными системами
Снижение времени
на анализ запросов
пользователей и поиска
информации
2
3.
Среда взаимодействия поисково-аналитическойсистемы
ИСТОЧНИ
КИ
ДАННЫХ
ЕАИС РТ
Файловые хранилища
Электронные архивы
СЭД
ИНФОРМАЦИОННО-ПОИСКОВАЯ
СИСТЕМА
ПОИСКОВЫЕ
ВЗАИМОДЕЙСТ
ИНДЕКСЫ/
ВИЕ С
АЛГОРИТМЫ
ПОЛЬЗОВАТЕЛЕ
М
ПОЛЬЗОВАТЕ
ЛИ
ABBYY Intelligent Search
Проведение синтаксического
разбора поискового запроса для
поиска необходимых документов.
Анализ формы слов, их значений,
связей и контекста.
Ранжирование результатов
поиска на основе смысла слов,
предложений и контекста.
Информационно-поисковая
система
АНАЛИТИ
КА
Аналитические
системы/СППР
3
4.
Характеристика объектаавтоматизации
В основу структуры Системы заложен модульный принцип организации,
обеспечивающий возможность встраивания дополнительных подсистем (модулей)
и взаимодействия с другими информационными системами.
ПОИСКОВЫЕ
ИНДЕКСЫ/
АЛГОРИТМЫ
Информационное взаимодействие
с внешними системами –поставщиками данных для Системы
Извлечение текста из документов/
создание поисковых индексов
ВЗАИМОДЕЙСТ
ВИЕ С
ПОЛЬЗОВАТЕЛЕ
М
Формирование поисковых
запросов
Отображение результатов поиска
Анализ запроса
Фильтрация, сортировка
результатов поиска
Поиск информации
Просмотр найденных документов
АНАЛИТИ
КА
Инструменты отображения
анализа данных
Поддержка принятия решения
Построение ретроспективы
4
5.
Интерфейспользовате
ля
1
2
3
4
Область формирования
поискового запроса
Управление сортировкой
результатов
Фрагмент найденного
документа
Данные о месте
хранения информации
(источнике)
5
6
Область
дополнительной
фильтрации
результатов
Область
экспресс-аналитики
5
6.
Результаты полнотекстовогопоиска
Найдено:
3
6
7.
Результаты семантическогопоиска
Найдено:
89
При семантическом поиске количество найденных
документов увеличилось в 30 (!) раз.
7
8.
Сравнение реализованныхалгоритмов поиска
ПОЛНОТЕКСТОВЫЙ
ПОИСК
СЕМАНТИЧЕСКИЙ
ПОИСК
Поиск конкретного
документа по
существенной его части
Поиск документов
близких по смыслу к
тексту запроса
В результатах поиска с учетом морфологии
учитываются перечисленные ниже критерии
в порядке убывания важности:
В результатах семантического
поиска учитываются следующие
критерии:
форма слов в запросе;
порядок следования слов в запросе;
только те слова в документе, которые имеют
такой же смысл, как и слова поискового запроса;
близость слов из запроса в документе;
все критерии ранжирования, которые применяются
при полнотекстовом поиске (с учетом морфологии);
слова, которые встречаются во многих документах,
по которым проводится поиск, учитываются с меньшим
приоритетом по сравнению со специфичными терминами;
связь между словами в запросе и в документе;
частота слов из запроса в найденном документе;
гиперонимы (обобщения) слов в запросе;
частота слов из запроса в документах данного
поискового индекса
приоритет синонимов над гиперонимами
синонимы слов в запросе;
8
9.
Спасибоза
внимание