Similar presentations:
Инновационные технологии в переводе
1. Инновационные технологии в переводе
ИННОВАЦИОННЫЕТЕХНОЛОГИИ В ПЕРЕВОДЕ
2. План
ПЛАН1.История
развития машинного
перевода.
2. Современные системы
автоматизированного перевода.
3. Наиболее популярные онлайнсервисы.
3.
Термином «машинный перевод» (МП, он жеMachine Translation или MT) называют
действие, когда один естественный язык
переводится на другой с использованием для
этого специального программного обеспечения.
Машинный, а точнее, компьютерный перевод
— это письменный перевод, поскольку в
результате получается письменный текст.
4.
История машинного перевода берет начало вXVII веке, когда такими философами, как
Лейбниц
и
Декарт
было
выдвинуто
предположение о существовании некоего кода,
соединяющего между собой слова разных
языков.
Все предположения носили гипотетический
характер,
и
никому
не
удавалось
в
действительности
создать
машину
для
перевода.
5.
В конце 1830-х гг. о расширении привычныхвозможностей перевода задумался английский
изобретатель Чарльз Бэббидж, предложивший
проект первого в истории компьютера.
Суть работы будущей машины состояла в
использовании потенциала машинной памяти
для хранения словарей.
6.
Первые заявления на получение патента на«переводческую машину» были поданы в
середине 30-х годов ХХ века. Одно заявление
было подано французским изобретателем
Ж.
Арцруни,
просто
создавшим
автоматический двуязычный словарь на
перфоленте.
7.
Другое было сделано советским ученымПетром Троянским, чье изобретение было
более детальным.
Оно включало в себя, как двуязычный словарь,
так и способы работы с грамматическими
ролями между двумя языками на основе
Эсперанто.
8. Данная система представляла собой три этапа:
ДАННАЯ СИСТЕМА ПРЕДСТАВЛЯЛАСОБОЙ ТРИ ЭТАПА:
первый заключался в следующем – редактор,
носитель языка, должен был связать слова
исходного языка (ИЯ) в логические формы в
соответствии с синтаксическими функциями;
на
втором этапе машина должна была
«перевести» все эти формы на язык перевода
(ПЯ);
на третьем этапе носитель языка перевода
занимался
редактированием
полученного
результата.
9.
Первый план по созданию машин дляперевода на базе компьютеров был предложен
Уорреном Уивером, исследователем Фонда
Рокфеллера, в его меморандуме от июля
1949года.
Данные предложения базировались на теории
информации, получившей успех во время
Второй
Мировой
войны
в
связи
с
криптографией и распространения идеи об
универсальных
принципах
естественных
языков.
10.
В 1954 г. состоялся так называемый«Джорджтаунский эксперимент»: публике был
представлен первый электронный переводчик
– русско-английская система IBM Mark II,
содержавшая словарь из 250 единиц и 6
грамматических правил.
11.
Ранниесистемы
использовали
большие
двуязычные словари и запрограммированные
вручную правила, по выстраиванию на выходе
слов в правильном порядке.
В конечном итоге, такой способ был признан
ограниченным, и развитие лингвистических
наук, например, генеративной лингвистики
или трансформационной грамматики, было
нацелено на улучшение качества перевода.
12.
Большой удар был нанесен по исследованиямв
области
машинного
перевода
после
публикации отчета ALPAC ( специальный
комитет по прикладной лингвистике) в 1966
году.
В результате было установлено, что машинный
перевод дороже, медленнее и менее точный в
сравнении
с
переводом,
выполненным
человеком,
и
несмотря
на
большие
капиталовложения, в ближайшее время
машинный перевод не достигнет того же
качества, что и перевод, выполненный
человеком.
13.
Новый этап развития технологий машинногоперевода
связан
с
появлением
вычислительной техники в конце 70-х –
начале 80-х гг. ХХ в.
Программисты отказались от идеи создания
«идеальной» машины-переводчика: новые
системы
разрабатывались
с
целью
многократного увеличения скорости перевода
информации, но с обязательным участием
человека
для
достижения
идеального
качества.
14.
В 80-е годы в Японии был большой ажиотаж,связанный
с
машинным
переводом.
С
появлением компьютеров пятого поколения
Япония планировала прыгнуть выше всех в
области техники и программирования, проект,
связанный с созданием программ для перевода
с/на
английский,
заинтересовал
многие
компании (Fujitsu, Toshiba, NTT, Brother,
Catena, Matsushita, Mitsubishi, Sharp, Sanyo,
Hitachi, NEC, Panasonic, Kodensha, Nova, Oki).
Исследования 80-х годов основывались на
переводе лингвистических единиц при помощи
морфологического,
синтаксического
и
семантического анализа.
15.
Очередной виток исследований в 90-х гг.прошлого века связан с колоссальным
прогрессом
современных
персональных
компьютеров и появлением Интернета.
Возможности перевода в режиме онлайн
позволяют преодолеть языковой барьер и
осуществлять навигацию по иностранным
сайтам.
16.
В настоящий момент большое количествоисследований ведется в области статистического
машинного перевода и машинного перевода на
базе примеров перевода.
Сегодня
немногие
компании
используют
статистический
машинный
перевод
в
коммерческих
целях,
например,
Microsoft
(использует свою собственную патентованную
статистическую программу МП для перевода
статей базы).
Возобновился
интерес
к
гибридизации,
исследователи совмещают синтаксические и
морфологические (т. е. лингвистические) знания
в статистических системах с уже существующими
правилами.
17. два аспекта, определяющих актуальность задач машинного перевода:
ДВААСПЕКТА,
ОПРЕДЕЛЯЮЩИХ
АКТУАЛЬНОСТЬ
ЗАДАЧ
МАШИННОГО
ПЕРЕВОДА:
все возрастающая потребность в переводах в
науке, литературе, дипломатии, экономике и
других областях деятельности;
для машинного перевода гораздо яснее
критерии оценивания результатов, чем в
задачах понимания текстов, организации
диалогов и др.
18. К современным средствам автоматизации перевода можно отнести,
К СОВРЕМЕННЫМ СРЕДСТВАМАВТОМАТИЗАЦИИ ПЕРЕВОДА МОЖНО
ОТНЕСТИ,
во-первых,
компьютерные
словари
типа
ABBYY Lingvo, MultiLex, Polyglossum, а также
онлайновый словарь MultiTran, глоссарии,
энциклопедии,
справочные
издания,
стилистические
справочники,
онлайновые
газетные и журнальные архивы в электронном
формате;
во-вторых,
так
называемые
системы
переводческой памяти (Translation Memory)
типа Trados Translator's Workbench, Deja Vu,
SDLX, Wordfast, OmegaT и другие;
в-третьих, системы машинного перевода типа
PROMT, STYLOS, MAGIC GOODY и другие.
19.
Электронный словарь – компьютерная базаданных,
содержащая
особым
образом
закодированные
словарные
статьи,
позволяющие осуществлять быстрый поиск
слов, часто с учетом морфологических форма и
с возможностью поиска сочетаний слов, а
также с возможностью изменения направления
перевода.
20. Преимущества электронных словарей:
ПРЕИМУЩЕСТВА ЭЛЕКТРОННЫХСЛОВАРЕЙ:
1. высокая скорость обработки информации;
2. портативность носителя информации;
3. наличие новейшей лексики за счет быстрого
обновления, особенно в быстро развивающихся
областях (нанотехнологии, компьютерные
технологии и т.п.);
4. одновременный доступ к нескольким
словарям;
5. возможность смены направления перевода.
21. Translation Memory (ТM)
TRANSLATION MEMORY (ТM)Один из новых инструментов переводчика база данных, где хранятся выполненные
переводы, иногда ее называют еще «память
переводов»
Принцип работы технологии ТМ довольно
прост - в процессе перевода пары "исходный
текст - конечный (переведенный) текст"
накапливаются в базе (или базах) данных и
затем используются для перевода новых
документов.
22. Система переводческой памяти Trados
СИСТЕМАПЕРЕВОДЧЕСКОЙ ПАМЯТИ
TRADOS
предназначена для больших переводческих
центров, где накопилось много параллельных
текстов (два текста, один из которых — перевод
другого).
Она позволяет не переводить дважды одно и то
же предложение, а просто находит такое же
или очень похожее предложение в базе
параллельных
текстов
и
выдает
уже
сделанный кем-то перевод. При больших
массивах однотипных текстов такой подход
весьма эффективен.
23. выгоды, которые предоставляет технология TM пользователям:
ВЫГОДЫ, КОТОРЫЕ ПРЕДОСТАВЛЯЕТТЕХНОЛОГИЯ TM ПОЛЬЗОВАТЕЛЯМ:
Повышение
производительности
труда
переводчика. Подстановка даже на 80%
совпадающих сегментов из базы переводов,
может сократить время работы над переводом
на 50-60%.
Экономия
средств, как прямое следствие
экономии времени.
Единство терминологии стиля при наличии
базы переводов по тематике переводимого
документа.
Создание преемственности рабочего процесса,
что гарантирует отсутствие сбоев в работе
компании.
24. Translation Memory не лишена ряда существенных недостатков:
TRANSLATION MEMORY НЕ ЛИШЕНАРЯДА СУЩЕСТВЕННЫХ НЕДОСТАТКОВ:
Большие
стартовые затраты.
Большой
объем ручной работы.
25. Системы машинного перевода:
СИСТЕМЫ МАШИННОГО ПЕРЕВОДА:Для
обозначения
автоматизированного
перевода используют термин САТ. Английский
термин
–
computer-assisted
translation,
computer-aided translation – CAT.
При узком понимании этого понятия к САТ
относят
такие
системы
автоматизации
перевода как SDL Trados, Deja Vu, StarTransit,
Wordfast и другие.
26. Системы машинного перевода отличают по трем аспектам:
СИСТЕМЫ МАШИННОГО ПЕРЕВОДАОТЛИЧАЮТ ПО ТРЕМ АСПЕКТАМ:
рабочим языкам (различают двуязычные и
многоязычные системы машинного перевода);
типам текстов (для перевода письменного
текста и устного диалога);
ограничениям
по
предметной
области
(обусловлены поддержкой в них лексики,
соответствующей той или иной области знаний:
медицины, информатики, математики и пр.).
27. традиционно системы машинного перевода делятся на три категории:
ТРАДИЦИОННО СИСТЕМЫ МАШИННОГОПЕРЕВОДА ДЕЛЯТСЯ НА ТРИ КАТЕГОРИИ:
основанные на правилах (rule-based), где
грамматика проработана глубже, языковых
правил больше,
статистические или основанные на примерах
(example-based),где происходит динамическое
порождение языковых правил для конкретных
текстовых примеров,
гибридные системы.
28. основанные на правилах системы
ОСНОВАННЫЕ НА ПРАВИЛАХ СИСТЕМЫСистемы на основе грамматических правил
производят анализ текста, который используется
в процессе перевода.
Перевод производится на основе встроенных
словарей для данной языковой пары, а так же
грамматик,
охватывающих
семантические,
морфологические, синтаксические закономерности
обоих
языков.
Основной принцип работы таких систем — связь
структур
исходного
и
конечного
текстов.
29. Системы на основе грамматических правил часто разделяют еще на три подгруппы:
СИСТЕМЫ НА ОСНОВЕ ГРАММАТИЧЕСКИХПРАВИЛ ЧАСТО РАЗДЕЛЯЮТ ЕЩЕ НА ТРИ
ПОДГРУППЫ:
системы пословного перевода,
трансфертные
и
системы
интерлингвистические системы.
30. Преимущества систем на основе грамматических правил:
ПРЕИМУЩЕСТВА СИСТЕМ НА ОСНОВЕГРАММАТИЧЕСКИХ ПРАВИЛ:
грамматическая
и синтаксическая
точность,
стабильность
возможность
результата,
настройки на
специфическую предметную область.
31. недостатки систем на основе грамматических правил:
НЕДОСТАТКИ СИСТЕМ НА ОСНОВЕГРАММАТИЧЕСКИХ ПРАВИЛ:
необходимость
создания, поддержки
и обновления лингвистических баз
данных,
трудоемкость создания такой системы,
высокая стоимость.
32. Статистические системы
СТАТИСТИЧЕСКИЕ СИСТЕМЫиспользуют
статистический анализ.
В систему загружается двуязычный корпус
текстов (содержащий большое количество
текста на исходном языке и его «ручной»
перевод на требуемый язык), после чего
система
анализирует
статистику
межъязыковых соответствий, синтаксических
конструкций и т. д.
Система является самообучаемой — при
выборе варианта перевода она опирается на
полученную
ранее
статистику
33. Достоинства статистическихсистем:
ДОСТОИНСТВАСТАТИСТИЧЕСКИХСИСТЕМ:
быстрота настройки и
легкость
добавления новых
направлений перевода.
34. Недостатки:
НЕДОСТАТКИ:наличие
многочисленных
грамматических ошибок и
нестабильность
перевода.
35. Гибридные системы
ГИБРИДНЫЕ СИСТЕМЫсочетают
в себе подходы, описанные
ранее и
позволят
объединить все преимущества,
которыми
обладают
статистические
системы и системы, основанные на
правилах.
36. Для автоматизации своей переводческой деятельности многие лингвисты используют
ДЛЯ АВТОМАТИЗАЦИИ СВОЕЙПЕРЕВОДЧЕСКОЙ ДЕЯТЕЛЬНОСТИ МНОГИЕ
ЛИНГВИСТЫ ИСПОЛЬЗУЮТ
онлайн - переводчики, такие как Promt,
Google, Transneed, онлайн - словари Multitran,
Lingvo, MrTranslate и другие онлайн ресурсы.
CAT-системы,
например Transit, Trados,
Wordfast, Across, Meta Texis, Star и т.п.
Они характеризуются наличием специальной
памяти Translation Memory, в которой
накапливаются соответствия оригинал-перевод
37. Программы для проверки правильного синтаксиса и стиля текста в текстовом редакторе, входящие в блок орфографического контроля:
ПРОГРАММЫ ДЛЯ ПРОВЕРКИ ПРАВИЛЬНОГОСИНТАКСИСА И СТИЛЯ ТЕКСТА В ТЕКСТОВОМ
РЕДАКТОРЕ, ВХОДЯЩИЕ В БЛОК
ОРФОГРАФИЧЕСКОГО КОНТРОЛЯ:
1. Программа Bullfighter проверяет
правописание, синтаксис и стиль текста в
приложениях Microsoft Word и PowerPoint,
2. English Writing Software
3. Grammar Checker 7.0
4. Grammar Slammer-Non-Windows 4.0
5. Grammar Slammer 4.2
6. Grammatica English
7. SpellCheckPlus
8. WhiteSmoke English 2009
38. наиболее популярные онлайн-сервисы, доступные современным пользователям сети Интернет:
НАИБОЛЕЕ ПОПУЛЯРНЫЕ ОНЛАЙН-СЕРВИСЫ,ДОСТУПНЫЕ СОВРЕМЕННЫМ
ПОЛЬЗОВАТЕЛЯМ СЕТИ ИНТЕРНЕТ:
Translate.ru (онлайн-переводчик компании
ПРОМТ)
SYSTRANet (Systran)
Google Trnslate (Google)
Free Translation (SDL)
Babel Fish (Systran)
Worldlingo (Systran)
InterTran (Translation Experts Limited)
ImTransator (Smartlink Corp)
Tranlslate Online.ua
Windows Life Translator (Microsoft)
39. 1. Translate.ru (PROMT) http://www.translate.ru
1. TRANSLATE.RU (PROMT)HTTP://WWW.TRANSLATE.RU
Компания
ПРОМТ считается абсолютным
лидером на российском рынке услуг
онлайнового перевода. Данный сервис
существует с 1998 года (для западных
пользователей есть версии на других
языках
по
адресу:
www.onlinetranslator.com).
Онлайн-переводчик
ПРОМТ
поддерживает семь европейских языков
(английский,
русский,
итальянский,
немецкий, испанский, португальский и
французский) и осуществляет переводы в
25 направлениях:
40.
Можно выбрать определенную тематику –общение, бизнес, компьютеры, автомобили,
путешествия, спорт или «другое».
Пользователь имеет возможность выбрать
дополнительные
настройки
(подключить
специализированные словари, установить
настройки для перевода текстов большего
объема,
получить
грамматическую
информацию).
Недостатком
программы
является
ограничение объема вводимого текста до 500
знаков.
41. 2. SYSTRANet http://www.systranet.com/
2. SYSTRANETHTTP://WWW.SYSTRANET.COM/
Сервис
онлайн-перевода,
предлагаемый
другим мировым лидеров в области систем
машинного
перевода
американской
компанией Systran.
Онлайн-перевод
текста
этого
сервиса
поддерживает 15 языковВ общей сложности,
данный переводчик осуществляет переводы в
53 языковых направлениях.
42.
Кроме обычной функции перевода связныхтекстов онлайн-переводчик SYSTRANet также
осуществляет переводы веб-страниц, а также
файлов с расширениями .txt, .htm, .rtf.
Кроме того, пользователю предлагается опция
выбора тематических словарей или создания
собственного словаря.
Но чтобы создать свой словарь или загрузить
файл поддерживаемого формата, сначала
необходимо зарегистрироваться на данном
сайте.
43. 3.Google Translate http://translate.google.com/ http://translate.google.ru/
3.GOOGLE TRANSLATEHTTP://TRANSLATE.GOOGLE.COM/
HTTP://TRANSLATE.GOOGLE.RU/
Сервис Google Translate представляет собой
онлайн-переводчик текстов и веб-страниц,
который является одним из элементов
поисковой системы Google.
Данный онлайн-переводчик работает с 51
языком осуществляет перевод в 2250 языковых
направлениях.
В данном сервисе появилось несколько новых
удобных
функций.
Теперь
можно
не
пользоваться кнопкой «Перевести», так как
программа автоматически переводит слово или
текст по мере их ввода в соответствующее поле.
44.
При переводе отдельных слов программафункционирует
как
онлайн-словарь
и
предлагает все возможные варианты перевода,
разбивая все слова по частям речи.
Программа предлагает пользователю выбрать
опцию «Показать транслитерацию», которая
осуществляет
написание
данного
слова
средствами расширенной латиницы.
Как и другие онлайн-переводчики текстов,
Google осуществляет перевод веб-страниц.
Кроме того, он поддерживает дополнительную
поисковую функцию «Поиск с переводом»,
которая позволяет найти веб-сайты на языке
пользователя по переводу того или иного слова
или предложения.
45. 4. Free Translation www.freetranslation.com
4. FREE TRANSLATIONWWW.FREETRANSLATION.COM
Сервис онлайн-перевода Free Translation,
предоставляемый
компанией
SDL,
поддерживает 32 языка.
В общей сложности, данный переводчик
осуществляет переводы в 86 языковых
направлениях.
46.
Free Translation предоставляет дополнительныеопции по улучшению качества переводов
исключительно
членам
FreeTranslation
Platinum Club, для регистрации в котором
необходимо внести плату в размере 9,95 долл. (в
год).
Установив
дополнительные опции, можно
воспользоваться
специализированными
словарями по тематикам Business, IT, Current
Affairs и переводить большие тексты объемом до
10 тыс. знаков.
47. 5. Babel Fish http://babelfish.yahoo.com/
5. BABEL FISHHTTP://BABELFISH.YAHOO.COM/
Одна из первых систем автоматизированного
перевода, доступного в режиме онлайн, была
запущена в1997 году компанией AltaVista, но
затем была интегрирована поисковой системой
Yahoo, дополнившей данный сервис онлайнперевода новыми языками.
Онлайн-переводчик
Babel Fish, как и
следующий далее переводчик Worldlingo,
использует технологию перевода Systran.
Онлайновая «рыбка» осуществляет перевод
текстов онлайн объемом до 150 слов и вебсайтов в 38 языковых направлениях:
48.
Babel Fish ограничивает объем текста до 5Кбайт (приблизительно 800 слов), данное
ограничение сохраняется и при переводе webстраниц.
Как
правило,
качество
переводов,
выполняемых
Babel
Fish,
сравнимо
с
качеством переводов онлайн от Google
Translate, но уступает качеству переводов от
Translate.ru.
При
переводе
в
данной
программе обычно теряется разбивка на
абзацы.
49. 6. Worldlingo http://www.worldlingo.com/en/products_services/worldlingo_translator.html
6. WORLDLINGOHTTP://WWW.WORLDLINGO.COM/EN/PRODUCTS_
SERVICES/WORLDLINGO_TRANSLATOR.HTML
Данный онлайн-переводчик поддерживает 32
языка и позволяет выполнить перевод текстов
онлайн объемом до 500 слов.
Данный
онлайн-переводчик
имеет
преимущество в плане функциональных
возможностей является возможность выбора 20
специализированных
тематик
и
ввода
специальных символов, характерных для
каждого языка.
50. 7. InterTran http://www.tranexp.com:2000/Translate/result.shtml
7. INTERTRANHTTP://WWW.TRANEXP.COM:2000/TRANSLATE/R
ESULT.SHTML
Онлайн-переводчик InterTran (InteractiveTran)
представляет собой один из продуктов
компании Translation Experts Limited.
Переводчик поддерживает 27 языков перевода.
Текст для перевода можно вводить на любом из
этих языков, однако недостатком этого
переводчика является то, что он переводит
только тексты и не позволяет выбрать
специализированные словари при переводе
текста определенной тематики.
51. 8. Im Translator http://translation.imtranslator.net
8. IM TRANSLATORHTTP://TRANSLATION.IMTRANSLATOR.NET
Онлайн-сервис Im Translator является продуктом
американской корпорации Smartlink Corp, также
основанным на базе технологии, разработанной
российской компанией ПРОМТ. В отличие от
сервиса Translate.ru, Im Translator снабжен
стандартным набором функций и выполняет
перевод в 19 языковых направлениях
К
дополнительным
функциональным
возможностям
данного
онлайн-переводчика
относятся наличие электронного словаря и
программы для проверки орфографии. Однако
данный переводчик не предлагает пользователю
опцию подключения тематических словарей.
52. 9. Translate Online.ua http://pereklad.online.ua/
9. TRANSLATE ONLINE.UAHTTP://PEREKLAD.ONLINE.UA/
Это украинский сервис онлайн-перевода,
поддерживающий 7 языков.
Переводчик
предлагает
выбрать
соответствующую тематику
текста: авто,
бизнес, интернет, общий, право и техника.
Кроме того, имеется простая, но очень
полезная функция – непосредственно под
окном для ввода текста расположен небольшой
удобный словарь.
53. 10. Windows Live Translator http://www.microsofttranslator.com/Default.aspx
10. WINDOWS LIVE TRANSLATORHTTP://WWW.MICROSOFTTRANSLATOR.COM/DEF
AULT.ASPX
Компания
Microsoft
запустила
свой
онлайновый сервис перевода Windows Live
Translator.
По своим функциональным возможностям
данный онлайн-переводчик практически не
отличается
от
стандартных
онлайнпереводчиков. Переводчик поддерживает 19
языков.
54.
Все переводы с английского языка наевропейские
языки
(кроме
русского),
китайский
и
японский
осуществляются
собственным переводчиком, разработанным
компанией Microsoft, а все остальные переводы
выполняются
на
базе
переводческой
технологии Systran.
Удобством этого онлайн-переводчика является
русскоязычный интерфейс, устанавливаемый
автоматически, в зависимости от IP.
Однако
разработчики
наложили
ряд
ограничений на функциональные возможности
данного сервиса: в режиме перевода текста
можно загружать тексты объемом только до
500 символов.