Similar presentations:
История возникновения и развития RAG для AI-ботов: от концепции к современным применениям
1.
МИНОБРНАУКИ РОССИИФедеральное государственное бюджетное
образовательное учреждение высшего образования
«Тульский государственный университет»
Институт прикладной математики и информатики
Кафедра прикладной математики и информатики
ИСТОРИЯ И МЕТОДОЛОГИЯ ПРИКЛАДНОЙ МАТЕМАТИКИ И ИНФОРМАТИКИ
Реферат
направление 01.03.02
Прикладная математика и информатика
История возникновения и развития RAG для AI-ботов: от
концепции к современным применениям
(тема работы)
Студент группы 221211
Руководитель работы
Захаров С.С.
(фамилия и инициалы)
доцент Смирнов О.И.
(уч. степень, фамилия и инициалы)
Тула, 2025
2.
RAG — революция в искусственноминтеллекте
Retrieval-Augmented Generation (RAG) представляет собой революционный
подход в области искусственного интеллекта, который:
• Комбинирует два ключевых процесса: поиск информации и генерацию
текста
• Позволяет языковым моделям выходить за пределы заложенных при
обучении знаний
• Обеспечивает доступ к актуальным данным без необходимости
переобучения модели
• Значительно повышает точность и достоверность ответов ИИ-систем
3.
Ограничения традиционных подходовПроблемы, которые решил RAG:
1. Фиксированные знания:
- Модели "замораживались" на момент обучения
- Не учитывали новые данные и изменения
2. Галлюцинации:
- До 40% ответов содержали ложную информацию
- Особенно в специализированных областях
3. Узкая специализация:
- Требовали дорогостоящего дообучения
- Не могли работать с редкими доменами
4.
Факторы, сделавшие RAG возможнымКлючевые технологические достижения:
- Прорыв в NLP:
- Трансформерные архитектуры (BERT, GPT-3)
- Качественное семантическое понимание текста
- Развитие поисковых систем:
- Векторные базы данных (FAISS, Annoy)
- Методы плотного поиска (dense retrieval)
- Вычислительные ресурсы:
- Облачные платформы
- Оптимизированные фреймворки (PyTorch, TensorFlow)
5.
Как работает RAG?Двухэтапная модель обработки:
1. Этап извлечения:
- Анализ запроса пользователя
- Поиск в базе знаний/интернете
- Отбор 3-5 наиболее релевантных документов
2. Этап генерации:
- Анализ найденных материалов
- Формирование связного ответа
- Учет контекста и стиля запроса
6.
Эволюция RAG с 2020 годаОсновные направления улучшений:
• Оптимизация поиска:
- Гибридные методы (dense + sparse)
- Ускорение работы в 5-7 раз
• Интеграция с LLM:
- Поддержка GPT-4, Claude, LLaMA
- Корпоративные решения (Microsoft 365 Copilot)
• Новые возможности:
- Мультимодальность
- Объяснение источников
- Кэширование запросов
7.
Где используется RAG сегодня?Основные сферы применения:
1. Клиентская поддержка:
- Чат-боты с доступом к базе знаний
- Снижение ошибок на 60%
2. Медицина:
- Анализ новых исследований
- Диагностическая поддержка
3. Бизнес:
- Обработка документов
- Юридический анализ
4. Образование:
- Персонализированные тьюторы
- Актуальные учебные материалы
8.
Будущее технологии RAGИтоги и перспективы:
• Достижения:
- Решение проблемы устаревания знаний
- Повышение точности ответов
• Будущее развитие:
- Улучшение скорости работы
- Расширение на новые форматы данных
- Повышение безопасности
• Вывод:
RAG становится стандартом для интеллектуальных систем,
сочетая мощь генерации с точностью данных
mathematics
informatics