54.25K
Categories: mathematicsmathematics informaticsinformatics

История возникновения и развития RAG для AI-ботов: от концепции к современным применениям

1.

МИНОБРНАУКИ РОССИИ
Федеральное государственное бюджетное
образовательное учреждение высшего образования
«Тульский государственный университет»
Институт прикладной математики и информатики
Кафедра прикладной математики и информатики
ИСТОРИЯ И МЕТОДОЛОГИЯ ПРИКЛАДНОЙ МАТЕМАТИКИ И ИНФОРМАТИКИ
Реферат
направление 01.03.02
Прикладная математика и информатика
История возникновения и развития RAG для AI-ботов: от
концепции к современным применениям
(тема работы)
Студент группы 221211
Руководитель работы
Захаров С.С.
(фамилия и инициалы)
доцент Смирнов О.И.
(уч. степень, фамилия и инициалы)
Тула, 2025

2.

RAG — революция в искусственном
интеллекте
Retrieval-Augmented Generation (RAG) представляет собой революционный
подход в области искусственного интеллекта, который:
• Комбинирует два ключевых процесса: поиск информации и генерацию
текста
• Позволяет языковым моделям выходить за пределы заложенных при
обучении знаний
• Обеспечивает доступ к актуальным данным без необходимости
переобучения модели
• Значительно повышает точность и достоверность ответов ИИ-систем

3.

Ограничения традиционных подходов
Проблемы, которые решил RAG:
1. Фиксированные знания:
- Модели "замораживались" на момент обучения
- Не учитывали новые данные и изменения
2. Галлюцинации:
- До 40% ответов содержали ложную информацию
- Особенно в специализированных областях
3. Узкая специализация:
- Требовали дорогостоящего дообучения
- Не могли работать с редкими доменами

4.

Факторы, сделавшие RAG возможным
Ключевые технологические достижения:
- Прорыв в NLP:
- Трансформерные архитектуры (BERT, GPT-3)
- Качественное семантическое понимание текста
- Развитие поисковых систем:
- Векторные базы данных (FAISS, Annoy)
- Методы плотного поиска (dense retrieval)
- Вычислительные ресурсы:
- Облачные платформы
- Оптимизированные фреймворки (PyTorch, TensorFlow)

5.

Как работает RAG?
Двухэтапная модель обработки:
1. Этап извлечения:
- Анализ запроса пользователя
- Поиск в базе знаний/интернете
- Отбор 3-5 наиболее релевантных документов
2. Этап генерации:
- Анализ найденных материалов
- Формирование связного ответа
- Учет контекста и стиля запроса

6.

Эволюция RAG с 2020 года
Основные направления улучшений:
• Оптимизация поиска:
- Гибридные методы (dense + sparse)
- Ускорение работы в 5-7 раз
• Интеграция с LLM:
- Поддержка GPT-4, Claude, LLaMA
- Корпоративные решения (Microsoft 365 Copilot)
• Новые возможности:
- Мультимодальность
- Объяснение источников
- Кэширование запросов

7.

Где используется RAG сегодня?
Основные сферы применения:
1. Клиентская поддержка:
- Чат-боты с доступом к базе знаний
- Снижение ошибок на 60%
2. Медицина:
- Анализ новых исследований
- Диагностическая поддержка
3. Бизнес:
- Обработка документов
- Юридический анализ
4. Образование:
- Персонализированные тьюторы
- Актуальные учебные материалы

8.

Будущее технологии RAG
Итоги и перспективы:
• Достижения:
- Решение проблемы устаревания знаний
- Повышение точности ответов
• Будущее развитие:
- Улучшение скорости работы
- Расширение на новые форматы данных
- Повышение безопасности
• Вывод:
RAG становится стандартом для интеллектуальных систем,
сочетая мощь генерации с точностью данных
English     Русский Rules