Similar presentations:
Автоматическая оценка удобочитаемости русскоязычных текстов
1.
Пучкова Екатерина, 425 группа1
2.
Актуальность работыМы сталкиваемся с оценкой сложности текстов во многих областях:
Повышение качества публикуемых текстов
Экспертиза школьных учебников, экзаменационных текстов и других
дидактических материалов
Подготовка деловой документации
Подготовка текстов нормативно-правовых актов
2
3.
УдобочитаемостьСложность текста – многоаспектное понятие, ряд аспектов трудно
формализуем
Удобочитаемость – один из аспектов.
Удобочитаемость интуитивно коррелирует со сложностью
Можно дать количественную оценку удобочитаемости
В работе рассматривается автоматическая оценка удобочитаемости
3
4.
План решения задачи1.
2.
3.
4.
5.
6.
Проанализировать существующие программы, оценивающие
сложность текстов;
Придумать собственный способ оценки удобочитаемости;
Разработать датасет;
Разработать программу для автоматического подсчета
удобочитаемости, основанную на применении собственного способа
оценки;
Провести эксперименты;
Оценить качество моделей и сравнить с результатами существующих
программ для оценки сложности текстов;
4
5.
Подход к оценке удобочитаемостиПредлагается разбить все тексты на 4 класса удобочитемости (1 – простой, 4 – самый
сложный)
Для количественной оценки удобочитаемости используется формула линейной
регрессии: