Similar presentations:
Многоуровневый мультиязычный инструмент
1.
Многоуровневый мультиязычный инструментдля унифицированного изучения интернет-контента
2.
Введение в проектМногоуровневый мультиязычный инструмент для изучения интернетконтента и прогнозирования предстоящих явлений
на основе анализа событийной почвы
Цели проекта
Преимущества перед ChatGPT
Система сбора и анализа информации из сети
Сбор информации для определения настроений и трендов
Фокус на анализ социальной ситуации и прогнозирование событий
Визуальные элементы для акцентирования цели
Разработка актуальной системы метрик для более тонкой оценки
социальной, экономической и геополитической ситуации
Глубокий анализ и прогнозирование
Избегание ангажированных публикаций
Узкая специализация и качественная обработка данных
Снижение ошибок при анализе
3.
Планына первый год
Основные цели
Расширение команды
1 тимлид
Создание инфраструктуры
Масштабирование систем
1 менеджер
2 ML-разработчика (senior)
1 бэкенд-разработчик (middle)
1 фронтенд-разработчик (middle)
1 QA-инженер (middle)
Калибровка точности формирования отчетов и аналитики настроения и
социального фона
1 DevOps-инженер (senior)
Релиз прогнозирования
1 Специалист по информационной безопасности (senior)
2 аналитика (senior+middle)
4.
Планына первый год
Сбор информации
Прототип
весна 2025
1 год
конец 2025
2 года
Количество ботов
3
Количество ботов
500
Количество ботов
1000
Охват каналов, шт.
30
Охват каналов, шт.
3000-4000
Охват каналов, шт.
25000-30000
Объем информации в день
сотни Мб - несколько Гб
Объем информации в день
100-500 Гб
Объем информации в день
5-15 ТБ
конец 2026
5.
Глубина прогнозированияСбор данных от стрингеров на
месте происходящих событий
Система метрик
Собственное метрическая система, базирующая на классическом понимании,
а также новейших социальных теориях. Широкая корреляция и объединение
с конечной кристаллизацией продуктовых показателей (индекс
«холодильника»), данных ежеминутного мониторинга настроений,
социального напряжения, кадровой политики, а также влияния иностранного
вмешательства на то или иное государство/рыночный сектор/медиа-сегмент
Сбор информации для определения настроений и трендов
Фокус на анализ социальной ситуации и прогнозирование событий
Визуальные элементы для акцентирования цели
Разработка актуальной системы метрик для более тонкой оценки
социальной, экономической и геополитической ситуации
Ключевые особенности
1
Online обновление в режиме 24/7
2
Многовекторность исследований, базирующихся на «живой»
информации
3
Гибкая интеграции полученной базы данных в работу как
основного продукта, так и пакетов услуг.
6.
Каналы заработкаЦелевая аудитория:
бизнес, государственные структуры
B2B
1/5
B2G
Выявление внутренних и внешних угроз с детализацией аналитики
Формирование общей сводки по трендам в регионе/стране (в том числе
с выделением интересующих отраслей/сегментов) и аналитика за
период
Прогнозирование на основе текущей ситуации и данных о прецедентах
Прогнозирование предстоящих кризисов и детализация актуальных
кризисов
Отслеживание рисков в онлайн-режиме (в том числе с выделением
интересующих отраслей/сегментов)
2/5
7.
Каналы заработкаЧеловекоподобные боты
(косвенные)
3/5
КАМ-модель (B2B/B2G)
4/5
Виртуальные ассистенты
B2B
Использование для формирования позитивного имиджа заказчика
Виртуальные ассистенты
Использование для формирования позитивного имиджа заказчика
Игровая индустрия
Аналитические данные
(B2B/B2G)
Подготовка и оценка социальной, экономической и политической
ситуации на основе данных, предоставленных заказчиком
Разработка реалистичных игровых персонажей
Создание "виртуальных компаньонов"
Интеграция с исследовательскими центрами, университетами
и НКО
5/5
8.
Архитектура системыи технологический стек
Сбор данных
Обмен
Хранение
Обработка
Telegram бот
веб-сокеты
PostgreSQL
нейросети
9.
Сопутствующиепередовые разработки
GAM-модель
Расширение линейных моделей, позволяющее моделировать нелинейные зависимости между предикторами
и целевой переменной
Процесс разработки
1
Анализ исходных данных и выявления ключевых признаков, влияющих на прогноз
2
Предобработка данных, включая очистку и трансформацию, для повышения их качества и пригодности для обучения модели
3
Выбор и настройка архитектуры классификатора с учетом особенностей данных и задач
4
Интеграция временных зависимостей и специфичных факторов для повышения точности прогнозов в разных контекстах
5
Реализация системы мониторинга и валидации моделидля отслеживания её эффективности и внесения улучшений на основе новых данных
6
Адаптация под реальные условия эксплуатации, с возможностью дальнейшего улучшения на основе обратной связи и анализа результатов
10.
Сопутствующиепередовые разработки
Человекоподобные боты
Введение в концепцию ботов для взаимодействия с закрытыми сообществами
Процесс разработки
1
Определение основных модулей и взаимодействия между ними, проектирование архитектуры
2
Разработка логики диалогов и сценариев взаимодействия с человеком
3
Разработка ядра бота
4
Тестирование и отладка
5
Развертывание и запуск в прод-среде
6
Мониторинг качества работы и дальнейшее улучшение
internet