Similar presentations:
Новые технологии развития интеллектуальных информационных систем
1. Глава VII. НОВЫЕ ТЕХНОЛОГИИ РАЗВИТИЯ ИНТЕЛЛЕКТУАЛЬНЫХ ИНФОРМАЦИОННЫХ СИСТЕМ.
2. 7.1. Интеллектуальный анализ данных (Data mining)
Data Mining - термин, используемый для описания открытиязнаний в БД, выделения знаний, изыскания данных,
исследования данных, обработки образцов данных, очистки
и сбора данных. Все эти действия осуществляются
автоматически и позволяют получать быстрые результаты.
Запрос преобразуется в SQL – формат. SQL запрос по сети
поступает в СУБД, которая управляет БД или хранилищем
данных. СУБД находит ответ на запрос и доставляет его
назад. Пользователь может затем разрабатывать
презентацию или отчет в соответствии со своими
требованиями.
Поддержка принятия управленческих решений на основе
накопленных данных может выполняться в 3х базовых
сферах
Сфера детализированных данных.
Сфера агрегированных показателей.
Сфера закономерностей.
3. Стадии процесса интеллектуального анализа данных
СТАДИИ ИАДСвободный поиск
(Discovery)
Выявление
закономерностей
условной
логики
Прогностическое
моделирование
(Predicate Modeling)
Анализ исключений
(Forensic Analysis)
Выявление
Выявление
ПредскаПрогнози- Выявление
закономертрендов
зание
рование Отклонений
ностей
и
неизвестных развития
Ассоциативколебаний
значений
процессов
ной логики
4. Структура корпоративной информационно – аналитической системы
OLTPOLTP
Транзакционные системы,
источники данных
Сбор, очистка и согласование данных из внешних источников
Информационные
системы руководителя
Хранилище данных
Генераторы
Системы оперативной,
Системы
запросов,
аналитической
интеллектуального
информационнообработки данных
анализа данных
поисковые системы
(OLAP)
(ИАД)
Область
детализированных
данных
Область
агрегированных
показателей
Область
закономерностей
5. Классификация технологических методов ИАД
МЕТОДЫ ИАДНепосредственное
использование
обучающих данных
(Data Retention)
Рассуждения
На основе
Прецендентов
(Case-based
Reasoning)
Математическая
Статистика:
1.Оценивание
параметров
Распределения
2.Дисперсионный
Анализ
3.КорреляционноРегрессионный
Анализ
4.Анализ временных
Рядов
5.Многомерный
Анализ:
-кластерный
-дискриминантный
-факторный
-мет. главных
компонент и др.
Выявление и
использование
формализованных
закономерностей
(Data Distillation)
Методы
логической
индукции
1.Деревья
Решений
(Decision Trees)
2.Индукция
Правил
(Rule Learning)
Эволюционное
моделирование
1. Генетические
Алгоритмы
2.Искусственные
нейронные
сети
6. 7.2. Нейронные сети
Нейронные вычисления или искусственные нейронные сети(ИНС) предполагают конструирование компьютеров с
архитектурными и обрабатывающими способностями, которые
имитируют некоторые способности человеческого мозга к обработке
информации.
Представления знаний в ИНС основаны на:
массированной параллельной обработке,
быстром поиске больших объемов информации
способности распознавать образцы, основанной на исторических
прецедентах.
Качествами человеческого мозга, которые, возможно, будут в
будущем присутствовать в ИС, являются:
массовый параллелизм,
распределенное представление информации и вычисления,
способность к обучению и способность к обобщению,
адаптивность,
свойство контекстуальной обработки информации,
толерантность к ошибкам,
низкое энергопотребление.
7. От биологических сетей к ИНС Машина фон Неймана по сравнению с биологической нейронной системой
Машина фон НейманаБиологическая
нейронная система
Процессор
Сложный
Высокоскоростной
Один или несколько
Простой
Низкоскоростной
Большое количество
Память
Отделена от процессора
Локализована
Адресация не по
содержанию
Интегрирована в
процессор
Распределенная
Адресация по
содержанию
Вычисления
Централизованные
Последовательные
Хранимые программы
Распределенные
Параллельные
Самообучение
Надежность
Высокая уязвимость
Живучесть
Специализация
Численные и символьные
операции
Проблемы восприятия
Среда
фунционирования
Строго определенная
Строго ограниченная
Плохо определенная
Без ограничений
8. Некоторые проблемы, решаемые в контексте ИНС
Классификация образов. (Указание принадлежностивходного образа, представленного вектором признаков, одному
или нескольким предварительно определенным классам)
Кластеризация/категоризация или классификация
образов «без учителя». Алгоритм кластеризации основан на
подобии образов и размещает близкие образы в один кластер.
Аппроксимация функций.
Пусть имеется обучающая выборка ((x1,y1),(x2,y2)...,(xn,yn))
(пары данных вход-выход), которая генерируется неизвестной
функцией (x), искаженной шумом. Задача аппроксимации
состоит в нахождении оценки неизвестной функции (x).
(Необходима при решении задач моделирования).
9.
Предсказание/прогноз.Пусть заданы n дискретных отсчетов {y(t1), y(t2)..., y(tn)}
в последовательные моменты времени t1, t2,..., tn.
Задача состоит в предсказании значения y(tn+1) в некоторый
будущий момент времени tn+1.
Оптимизация - нахождение такого решения, которое
удовлетворяет систему ограничений и максимизирует или
минимизирует целевую функцию)
Память, адресуемая по содержанию
доступна по указанию заданного содержания
Управление.
Рассмотрим динамическую систему, заданную совокупностью
{u(t), y(t)}, где u(t) - входное управляющее воздействие,
а y(t) - выход системы в момент времени t.
В системах управления с эталонной моделью целью управления
является расчет такого входного воздействия u(t), при
котором система следует по желаемой траектории, диктуемой
эталонной моделью (оптимальное управление двигателем)
10. Биологические нейронные сети
Нейрон (нервная клетка) является особой биологическойклеткой, которая обрабатывает информацию
11. Основные понятия Модель технического нейрона
МакКаллок и Питтс предложили использовать бинарныйпороговый элемент в качестве модели искусственного
нейрона,
Нейрон вычисляет взвешенную сумму n входных сигналов xj,
j = 1, 2... n, и формирует на выходе сигнал величины 1, если
эта
сумма превышает определенный порог u, и 0 - в противном
случае.
u - весовой коэффициент, связанный с постоянным входом x0=1
Положительные веса соответствуют возбуждающим связям, а
отрицательные – тормозным.
При соответствующим образом подобранных весах
совокупность параллельно функционирующих нейронов
способна выполнять универсальные вычисления.
Некоторые аналогии и отношения между
биологическими и искусственными нейронными сетями.
12. Некоторые аналогии и отношения между биологическими и искусственными нейронными сетями.
БиологическиеИскусственные
Сома
Узел
Дендриты
Вход
Аксон
Выход
Синапс
Вес
9
Много нейронов (10 )
Немного нейронов (от
десятка до сотни тысяч)
13. Основные понятия (продолжение) Архитектура нейронной сети
ИНС состоит из искусственных нейронов (или обрабатывающихэлементов), организованных различными путями для формирования
структуры сети.
Входные данные
Дендрит
(входной
провод)
Нейрон 1
Сигнальные данные
Вес W12
Аксон
Дендрит
(выходной
провод)
Синапс
(управление
потоком
электрохимических
импульсов)
Нейрон 3
Нейрон 2
Аксон
14. Обработка информации в искусственном нейроне
ВходныеСигналы
К1
Веса
W1j
Выходной сигнал Уj
К2
К3
W2j
W3j
Нейрон j
wijxi
Суммирование
Передаточная
функция
15. Нейронная сеть с одним скрытым слоем
ВыходнойСлой
Yj
Н
Нейронj
Скрытый
Слой
Входной
Слой
Н
Функция
передачи f
Весовая
сумма
Н
W1j
Н
Н
Н
Н
X1
W2j W3j
X2
X3
W4j
X4
ИНС может рассматриваться как направленный граф со взвешенными
связями, в котором искусственные нейроны являются узлами.
16. Систематизация архитектур сетей прямого распространения и рекуррентных (с обратной связью)
По архитектуре связей ИНС могут быть сгруппированы в 2 класса:сети прямого распространения, в которых графы не имеют
петель, и рекуррентные сети, или сети с обратными связями.
17. Основные понятия (окончание) Обучение
Способность к обучению является фундаментальным свойством мозга.В ИНС обучение -это настройка архитектуры сети и весов связей
для эффективного выполнения специальной задачи.
Для конструирования процесса обучения необходимо:
1)иметь модель внешней среды, в которой функционирует нейронная
сеть - знать доступную для сети информацию. Эта модель
определяет парадигму обучения.
2)необходимо понять, как модифицировать весовые параметры сети какие правила обучения управляют процессом настройки.
Существуют 3 парадигмы обучения:
1."с учителем", 2."без учителя" (самообучение), 3.смешанная.
Известны 4 основных типа правил обучения:
1.коррекция по ошибке,
2.машина Больцмана,
3.правило Хебба
4.обучение методом соревнования.
18. 7.3. Многоагентные системы и интеллектуальные технологии в Интернет
ОСНОВНАЯ ИДЕЯ ПРОГРАММНЫХ АГЕНТОВ-делегирование полномочий
ЦЕЛЬ ПОИСКОВЫХ АГЕНТОВ
-улучшить результаты поиска пользователей в Интернет,
выбрать наиболее релевантные документы.
При построении агентно-ориентированных систем можно
использовать 2 подхода:
Реализация единственного
автономного агента
Автономный агент взаимодействует
только с пользователем и
реализует весь спектр
функциональных возможностей,
необходимых в рамках агентноориентированной программы.
Разработка
мультиагентной системы.
MAC - программновычислительные комплексы,
где взаимодействуют
Различные агенты для решения
задач,которые трудны для
одного агента. (agencies)
19. Преимущества агентов перед простым обращением к машинам поиска
12
3
4
Технология оценки релевантности.
Поисковый агент передает пользователю не просто
результаты работы машины поиска, а предварительно
просматривает документы и выбирает из них наиболее
релевантные с его точки зрения
Агент может настраиваться на предпочтения
пользователя, то есть учитывать ряд ограничений на
поиск, формулируемых владельцем агента.
Некоторые агенты могут работать в off-line режиме,
т.е. когда пользователь дает задание агенту и отключается
от интернет, агент отправляется на сервер, где выполняет
работу. Когда пользователь снова подключается, агент
посылает ему выполненное задание.
4 Агенты могут обучаться. Пользователь оценивает
работу агента, а агент учитывая эти оценки может
корректировать свои критерии отбора информации.
20. Основные понятия
АГЕНТ - это аппаратная или программнаясущность, способная действовать в интересах
достижения целей, поставленных перед ним
владельцем и или пользователем.
Агенты достаточно условно подразделяются на
простые, смышленые (smart) и
интеллектуальные (intellegent).
Обычно выделяются 3 базовых класса архитектур:
архитектуры, которые базируются на принципах и
методах работы со знаниями;
архитектуры, основанные на поведенческих моделях
типа «стимул-реакция»;
гибридные архитектуры.
21. Архитектуры MAC их характеристики
АрхитектураПредставление
знаний
Модель
мира
Решатель
Интеллектуальная
Символьное
Исчисление
Логический
Реактивная
Автоматное
Граф
Автомат
Гибридная
Смешанное
Гибридная
Машина
вывода
Агенты, базирующиеся на знаниях, или интеллектуальные агенты
используют только точное представление картины мира в символьной
форме, а решения принимаются на основе формальных рассуждений и
использования методов сравнения по образцу.
Реактивными называются агенты и архитектуры, где нет эксплицитно
представленной модели мира, а функционирование отдельных агентов и
всей системы осуществляется но правилам типа ситуация—действие.
Гибридные архитектуры появились в результате объединения
интеллектуальной и реактивной архитектуры, т.к. ни одна сама по себе
не является оптимальной.
22. Неспециализированные поисковые агенты
Неспециализированные поисковые агенты обеспечиваютпоиск по ключевым словам и устойчивым словосочетаниям
-Поддерживают различные сервисы (передача запроса
пользователя сразу на множество машин поиска, настройка
+ на личные предпочтения пользователя, формирование
тематической БД на основе результатов поиска
пользователя, а иногда — и обучение агентов.
-Объединяют ссылки на сайты, найденные множеством
машин поиска, исключая повторные и неработающие
ссылки
-
-не в состоянии самостоятельно отобрать полезную
информацию и оставляет это пользователю.
-степень «попадания ответа в запрос» практически та же,
что и у машин поиска.
-не накапливают опыта по поиску в определенной ПО.
-обучение, если вообще допускается, занимает много
времени.
23. Специализированные поисковые агенты
Специализированные агенты поиска приспособлены искатьинформацию, например, только про музыку, или только про
книги, или только про котировки акций и т. д. Они «умеют»
очень хорошо работать на определенных сайтах с
фиксированным форматом данных.
кроме поиска предоставляют пользователям определенный
средств для организации и управления найденной
+ пакет
информацией.
В развитых системах этого класса имеются возможности:
сохранения параметров поиска для повторного использования
параллельного поиска на множестве ресурсов Интернета;
оформления результатов в виде отчетов и сохранения их в БД
слежения за обновлением информационных ресурсов Интернета, в
том числе с частотой, задаваемой пользователем.
Серьезный плюс - четкое срабатывание на хорошо
структурированных данных в известном формате.
-
Недостатки те же, что и у неспециализированных
24. Общие вопросы проектирования агентов и MAC
MAC опираются на статический подход (позволяют передаватьтолько данные приложений) и динамический подход (обеспечивают
возможности передачи исполняемого кода).
При динамическом подходе МАС-приложения используют парадигму
мобильных агентов.
Мобильные агенты - это программы, которые могут перемещаться по
сети, например по WWW. Они покидают клиентский компьютер и
перемещаются на удаленный сервер для выполнения своих действий,
после чего возвращаются обратно.
Использование мобильных агентов может быть
целесообразным, если они:
• уменьшают время и стоимость передачи данных
• позволяют преодолеть ограничение локальных ресурсов
• облегчают координацию
• позволяют выполнять асинхронные вычисления
25. ЗАКЛЮЧЕНИЕ
Развитие ИС возможно будут определять следующие идеи:1. Дальнейшее развитие технологии аналитической обработки
данных в режиме on-line (Analytical Processing).
2. Технология ИАД (DM-Data Mining), будет прогрессивно
изменяться, впитывая в себя новые эвристические и
индуктивные методы обобщения для формирования
требуемых знаний
3. Интеллектуальные мультиагентные системы (МА)
4. Отказ от “жестких” схем рассуждений, опирающихся на
дедуктивную процедуру.
5. Развитие индуктивных подходов в самообучении ИС, ИАД и
МАС
6. Развитие мягких вычислений
7. Развитие когнитивных технологий
8. Развитие динамических интеллектуальных систем