1.06M
Category: informaticsinformatics

Инструменты распознавания текстов и компьютерного перевода

1.

МКОУ «БАБЯКОВСКАЯ СОШ №1»
Инструменты распознавания
текстов
и компьютерного перевода
Учитель информатики: Шипилова Жанна Александровна

2.

Для ввода текстов в память компьютера с бумажных носителей используют сканеры, телефоны,
цифровые фотокамеры и программы распознавания символов.
Наиболее распространенная программа распознавания символов ABBYY Fine Reader
.
Free Online OCR
Convert JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu to Text
ABBYY FineReader — программа для оптического
распознавания
символов,
разработанная
российской
компанией ABBYY. Программа позволяет переводить
изображения
документов
(фотографий,
результатов
сканирования, PDF-файлов) в электронные редактируемые
форматы.
NewOCR - бесплатный OCR сервис, поддерживающий 29
языков распознавания, включая русский. Позволяет загружать
файлы в форматах JPEG, PNG, GIF, BMP, многостраничный
TIFF размером до 5 Мб, а также многостраничные PDF
размером до 20 Мб.

3.

Сколько времени потребуется для ввода в память компьютера текста некоторой книги,
содержащей 20 страниц с помощью сканера и программы для распознавания текста, если
известно, что на сканирование одной страницы уходит 3 с, на смену страницы в сканере — 2 с,
на распознавание страницы — 3 с?
3 + 2 + 3 = 8 * 20 = 160 с / 60 = 2,66 мин
Оно из изданий некоторой книги содержит 70 страниц. Каждая страница состоит из 30 строк, в
каждой строке в среднем 40 символов. Если бы мы вводили данную книгу с клавиатуры со
скоростью 150 символов в минуту, нам пришлось бы затратить …
70 * 30 * 40 = 84 000 м / 150 = 560 мин / 60 = 9,3 ч.

4.

Возможности современных компьютеров по хранению больших массивов информации и осуществлению
в них быстрого поиска положены в основу разработки компьютерных словарей и программ-переводчиков.
Компьютерные словари выполняют перевод отдельных слов и словосочетаний.
Компьютерные словари, в отличие от бумажных,
обеспечивают:
- возможность прослушать произношение слова;
- мгновенный поиск;
- большое количество слов.
Babylon представляет собой многоязычный словарь
Бумажные словари:
- меньшее количество слов;
- долгий поиск.

5.

Для перевода текстовых документов с одного языка на другой применяются:
программы-переводчики.
PROMT — российская компания, разработчик систем
машинного перевода; занимается исследованиями и
разработками в области искусственного интеллекта.
Основные направления работы — разработка решений для
машинного перевода и технологий для анализа текстовых
неструктурированных данных на русском и иностранных
языках.
Онлайн – переводчики:
Google Переводчик
Яндекс.Переводчик
Перевод технической
документации, деловой
переписки
лучше
выполнить в программе
переводчик.
Перевод художественных
текстов,
эмоционально
окрашенных,
богатых
гиперболами, метафорами,
лучше выполнить человеку.
English     Русский Rules