Архитектура DIRECTUM Ario
Реализация
Реализация
Реализация
Реализация
Реализация
Реализация
Направления развития
11.61M
Category: softwaresoftware

TeamLead команды SMART

1.

2.

Игорь Беляк
TeamLead команды SMART

3.

Интеллектуальная ECM
DIRECTUM Ario = ML + CV + NLP
Автоматизация выполнения рутинных операций в ECM
Структурированный и неструктурированный контент

4. Архитектура DIRECTUM Ario

DIRECTUM SmartService
управление, статистика,
API
DIRECTUM
TextExtractor Service
извлечение текстового
слоя из документов
DIRECTUM
Classifier Service
классификация документов
в различных разрезах
DIRECTUM
FactExtractor Service
извлечение значимых
данных (реквизитов)

5. Реализация

Сканер
Распознавание текста
Классификация документа
Извлечение значимых
данных
Предобработка
Компьютерное зрение (Computer Vision, CV)
Импорт и валидация
в DIRECTUM
Распознавание таблиц
Контекстное распознавание текста

6. Реализация

Сканер
техническое задание
договор
накладная спецификация
счет детализация протокол
входящее письмопостановление
приказ дополнительное соглашение
акт сверки
акт
Распознавание текста
Классификация документа
Извлечение значимых
данных
Импорт и валидация
в DIRECTUM
коммерческое предложение
служебная записка
ценовой лист
Векторное представление текста
Машинное обучение
Точность (precision) = TP / (TP + FP)
Полнота (recall) = TP / (TP + FN)
F1-мера = 2 * точность * полнота / (точность + полнота)
Правильность (accuracy) = (TP + TN) / все документы

7. Реализация

Сканер
техническое задание
договор
накладная спецификация
счет детализация протокол
входящее письмопостановление
приказ дополнительное соглашение
акт сверки
акт
Распознавание текста
Классификация документа
Извлечение значимых
данных
Импорт и валидация
в DIRECTUM
коммерческое предложение
служебная записка
ценовой лист

8. Реализация

Сканер
Распознавание текста
Классификация документа
Извлечение значимых
данных
Импорт и валидация
в DIRECTUM
Обработка естественного языка
Извлечение именованных сущностей (NER)
Правила, машинное обучение

9. Реализация

Сканер
Распознавание текста
Классификация документа
Извлечение значимых
данных
Импорт и валидация
в DIRECTUM
Conditional Random Fields (CRF)
Feature-инжиниринг

10. Реализация

Сканер
Распознавание текста
Классификация документа
Извлечение значимых
данных
Импорт и валидация
в DIRECTUM

11. Направления развития

Расширение библиотеки правил извлечения
~100 готовых правил для видов документов
Удобный инструмент настройки правил
Визуализация создания новых правил
Обучаемое извлечение фактов
«Интеллектуальная ECM»
Подготовка данных для поиска
Аннотация документов, проекты резолюций, автоответы
Интеллектуальное сравнение документов

12.

Спасибо!
English     Русский Rules