Similar presentations:
Инструменты распознавания текстов и компьютерного перевода
1.
МКОУ «БАБЯКОВСКАЯ СОШ №1»Инструменты распознавания
текстов
и компьютерного перевода
Учитель информатики: Шипилова Жанна Александровна
2.
Для ввода текстов в память компьютера с бумажных носителей используют сканеры, телефоны,цифровые фотокамеры и программы распознавания символов.
Наиболее распространенная программа распознавания символов ABBYY Fine Reader
.
Free Online OCR
Convert JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu to Text
ABBYY FineReader — программа для оптического
распознавания
символов,
разработанная
российской
компанией ABBYY. Программа позволяет переводить
изображения
документов
(фотографий,
результатов
сканирования, PDF-файлов) в электронные редактируемые
форматы.
NewOCR - бесплатный OCR сервис, поддерживающий 29
языков распознавания, включая русский. Позволяет загружать
файлы в форматах JPEG, PNG, GIF, BMP, многостраничный
TIFF размером до 5 Мб, а также многостраничные PDF
размером до 20 Мб.
3.
Сколько времени потребуется для ввода в память компьютера текста некоторой книги,содержащей 20 страниц с помощью сканера и программы для распознавания текста, если
известно, что на сканирование одной страницы уходит 3 с, на смену страницы в сканере — 2 с,
на распознавание страницы — 3 с?
3 + 2 + 3 = 8 * 20 = 160 с / 60 = 2,66 мин
Оно из изданий некоторой книги содержит 70 страниц. Каждая страница состоит из 30 строк, в
каждой строке в среднем 40 символов. Если бы мы вводили данную книгу с клавиатуры со
скоростью 150 символов в минуту, нам пришлось бы затратить …
70 * 30 * 40 = 84 000 м / 150 = 560 мин / 60 = 9,3 ч.
4.
Возможности современных компьютеров по хранению больших массивов информации и осуществлениюв них быстрого поиска положены в основу разработки компьютерных словарей и программ-переводчиков.
Компьютерные словари выполняют перевод отдельных слов и словосочетаний.
Компьютерные словари, в отличие от бумажных,
обеспечивают:
- возможность прослушать произношение слова;
- мгновенный поиск;
- большое количество слов.
Babylon представляет собой многоязычный словарь
Бумажные словари:
- меньшее количество слов;
- долгий поиск.
5.
Для перевода текстовых документов с одного языка на другой применяются:программы-переводчики.
PROMT — российская компания, разработчик систем
машинного перевода; занимается исследованиями и
разработками в области искусственного интеллекта.
Основные направления работы — разработка решений для
машинного перевода и технологий для анализа текстовых
неструктурированных данных на русском и иностранных
языках.
Онлайн – переводчики:
Google Переводчик
Яндекс.Переводчик
Перевод технической
документации, деловой
переписки
лучше
выполнить в программе
переводчик.
Перевод художественных
текстов,
эмоционально
окрашенных,
богатых
гиперболами, метафорами,
лучше выполнить человеку.