1.28M
Category: informaticsinformatics
Similar presentations:

Распознавание текста и системы компьютерного перевода

1.

Распознавание текста и системы
компьютерного перевода
ОБРАБОТКА ТЕКСТОВОЙ
ИНФОРМАЦИИ
Автор:
Учитель информатики ГБОУ
СОШ№275
Нелинов С.В.
Санкт-Петербург 2019г.

2.

КЛЮЧЕВЫЕ СЛОВА
•программы распознавания документов
•компьютерные словари
•программы-переводчики

3.

Программы оптического
распознавания документов
Для ввода текстов в память компьютера с бумажных
носителей используют сканеры и программы распознавания
символов.
Работа с программой распознавания текста
Бумажный носитель
помещается под крышку сканера
В программе отдаётся команда
Сканировать и распознать
Распознанный текст переносится
в окно текстового редактора

4.

Вместо
сканера
можно
использовать
цифровой
фотоаппарат или камеру мобильного телефона.
Оптическое распознавание документов

5.

Окно программы FineReader
Строка
меню
Панели
инструментов
Текущий пакет
страниц
Блочная структура
текста
Результат
распознавания

6.

Процесс обработки FineReader
• Сканирование (сканер, цифровой фотоаппарат, цифровая
видеокамера).
• Сегментация - выделение блоков на изображении.
• Распознавание – неоднозначно опознанные символы
выделяются цветом.
• Проверка ошибок- можно провести проверку грамматики.
• Сохранение результатов в виде отформатированного или
неотформатированного документа, или прямой передачи
в другое приложение - WORD, Excel в буфер обмена
Windows.

7.

Система оптического распознавания
символов
• Если исходный документ имеет типографическое качество
(достаточно крупный шрифт, отсутствие плохо напечатанных
символов или исправлений), то задача распознавания
решается методом сравнения с растровым шаблоном.
• При распознавании документов с низким качеством печати
(машинописный текст, факс и т.д.) используется метод
распознавания структурных элементов (отрезков, колец, дуг и
др.) символов. В искаженном символьном изображении
выделяются характерные детали и сравниваются со
структурными шаблонами символов.

8.

Компьютерные словари
Компьютерные словари выполняют перевод отдельных
слов и словосочетаний.
Компьютерные
словари
Установлен на компьютер
как самостоятельная программа
Встроен в текстовый процессор
В on-line-режиме в сети Интернет

9.

Дополнительные возможности
компьютерных словарей.
Компьютерныесловари
словаримогут
могут
являться
•• Компьютерные
являться
обеспечивают
кроме
мультимедийными,
т. е. предоставлять
многоязычными
- давать
пользователю
основногопоиск
быстрый
словаря
словарных
общеупотребительных
статей: "быстрый
пользователю
прослушивания
возможность
языки
и направление
слов содержать
набор",
когда выбрать
ввозможность
процессе
десятки
набора
слова
слов
в исполнении
дикторов,
носителей
перевода
(например,
англо-русский,
специализированных
возникает
список похожих
словарей
слов;
по
доступ
областям
к
языка.
испанско-русский
и т.словам
д.). информатика
знаний
часто
используемым
(техника, медицина,
по закладкам;и
др. )
возможность
ввода словосочетаний и др.

10.

Системы компьютерного перевода
Программа-переводчик
Формальное знание языка
Анализ текста
на исходном языке
Конструирование текста
на требуемом языке

11.

Системы компьютерного перевода
• Способны переводить многостраничные
документы с высокой скоростью (одна страница в
секунду);
• переводить Web-страницы "на лету", в режиме
реального времени;
• не применимы для перевода художественных
произведений, так как не способны адекватно
переводить метафоры, аллегории и другие
элементы художественного творчества человека.

12.

Как работают программы-переводчики
Чтобы
найти
перевод
неизвестного
иностранного
слова,
пользователю
электронного словаря достаточно ввести это
слово в строке поиска, и уже через несколько
мгновений
будет
получен
перевод.
Современные текстовые процессоры имеют в
своем составе словари, позволяющие
производить орфографическую проверку
правильности написания слов (на разных
языках).

13.

Программе, чтобы переводить, требуется
«знать» базовые правила грамматики двух
языков и исключения к ним, уметь
определить класс каждого слова, и прочие
его атрибуты, такие как одушевленность
или неодушевленность существительных,
переходность глаголов.
Программы переводчики действуют по
следующей схеме:
Подготовительный
этап:
сначала
предложение разбивается на слова,
производится их морфологический анализ
и поиск в словаре значений их лексем.
Потом
производится
синтаксический
анализ предложения, в ходе которого
выделяются придаточные предложения и
определяется функция каждого отдельного
слова.

14.

Лексический трансфер — каждому
слову присваивается перевод на
основе
выявленного
контекста,
грамматической формы оригинала, а
также
пометок,
сделанных
в
словарных статьях.
Затем производится структурный
трансфер — на этом этапе каждому
слову
присваивается
место
в
предложении,
устанавливаются
структурные связи и производятся
необходимые перестановки.
Наконец, выбранным переводам слов
придаются нужные (по мнению
программы)
грамматические
формы.

15.

16.

Рассмотрим простой пример. Переведем с помощью
системы перевода на английский язык фразу:
Информатика — это наука об информации.
Результат перевода:
The computer science is an information science.
А теперь с помощью той же программы переведем эту фразу
на русский язык. Получим:
Информатика — информатика.

17.

Онлайн сервис Яндекс Переводчик — это сервис автоматического
перевода слов и выражений, текстов с фотографий и картинок, сайтов и
мобильных приложений.
Сервис использует технологию машинного перевода, разработанную в Яндексе.
Переводчик работает как с традиционными (китайским, испанским, немецким),
так и с необычными языками (эльфийским, эсперанто, эмодзи). В арсенале
сервиса больше 90 языков.
Кроме того, для перевода в чате можно воспользоваться ботом

18.

ABBYY Lingvo — компьютерная программа и
семейство электронных словарей, разработанные
российской компанией «ABBYY»

19.

Самое главное
Для ввода текстов в память компьютера с бумажных носителей используют
сканеры и программы распознавания символов.
Возможности современных компьютеров по хранению больших массивов
информации и осуществлению в них быстрого поиска положены в основу
разработки компьютерных словарей и программ-переводчиков.
Компьютерные
словосочетаний.
словари
Для перевода
переводчики.
текстовых
выполняют
перевод
документов
отдельных
применяются
слов
и
программы-

20.

Домашнее задание
§4.5, № 204–205
English     Русский Rules