Сравнительный анализ систем машинного перевода

Материкина Анна Андреевна,
ЧОУ ВПО «Омская юридическая академия», г Омск

 

В статье рассматривается понятие машинного перевода, изучаются его разновидности, исследуется их функциональность. Будет представлено сравнение основных систем перевода. Выделим  основные различия в системах,  их недостатки и достоинства. А также рассмотрим примеры перевода на разных программах.

Ключевые слова: Системы, машинный перевод, SMT, RBMT, анализ, виды.

Цель написания статьи: изучение  систем машинного перевода, анализ их видов для выявления более удобной программы, которая позволит сделать качественный перевод.

Задачи: изучение систем машинного перевода, исследование специфики их работы, анализ качества машинного перевода с выделением программы лучшего качества. Значение затронутой темы заключается в активном использовании программ машинного перевода для решения определенных объемных или малых задач. Машинный перевод считается актуальной проблемой вплоть до сегодняшнего дня. При переводе  можно часто наблюдать погрешности в тексте. Их причиной служит низкое качество переводческих программ. Машинный перевод – это неизбежный атрибут коммуникаций во всем мире, следовательно, необходимо знать, что он собой представляет и уметь им пользоваться.

Впервые мысль о возможности машинного перевода высказал Чарльз Бэббидж (1791-1871), разработавший в 1836-1848 гг. проект цифровой аналитической машины - механического прототипа электронных цифровых вычислительных машин, появившихся через 100 лет. Идея Ч. Бэббиджа состояла в том, что память объемом 1000 50-разрядных десятичных чисел (по 50 зубчатых колес в каждом регистре) можно использовать для хранения словарей. Ч. Бэббидж привел эту идею в качестве обоснования для запроса у английского правительства средств, необходимых для физического воплощения аналитической машины, которую ему так и не удалось построить.

Машинный перевод – это перевод текста с одного естественного языка на другой естественный язык с помощью компьютерной программы.

Систему машинного перевода составляют:Статистические системы (Statistical Machine Translation, SMT);Системы на основе грамматических правил (Rule-Based Machine Translation, RBMT).

Обе системы были разработаны  software Hybrid TM.

Статистические системы (Statistical Machine Translation, SMT). Статистический машинный перевод - это разновидность машинного перевода текста, основанная на сравнении больших объёмов языковых пар. Языковые пары - тексты, содержащие предложения на одном языке и соответствующие им предложения на втором, могут быть как вариантами написания двух предложений человеком - носителем двух языков, так и переводом с исходного на язык перевода, выполненный человеком. Таким образом статистический машинный перевод обладает свойством «самообучения». Чем больше в распоряжении имеется языковых пар и чем точнее они соответствуют друг другу, тем лучший результат статистического машинного перевода.

Системы на основе грамматических правил (Rule-Based Machine Translation, RBMT). Основной принцип работы состоит в связи структур исходного и переводимого текста. Перевод осуществляется на базе встроенных словарей, грамматике, охватывающей морфологические, синтаксические и семантические закономерности исходного и переводимого текста. На основе этих данных исходный текст последовательно преобразуется в текст на требуемом языке.

Рассмотрим достоинства и недостатки систем машинного перевода. Для удобства оформим их в таблицу.

Название системы

Достоинства

Недостатки

Система SMT

  1. Наличие объемного корпуса, улучшающего и ускоряющего работу программы и при этом не требующего дополнительных действий;
  2. Хорошее качество перевода текста определенной тематики;
  3. Перевод напоминает работу переводчика - человека.
  1. Сильная привязка к корпусу;
  2. Отсутствие эквивалента в корпусе ограничивает возможность вносить изменения и улучшать качество переводимого фрагмента;
  3. Нет возможности предсказать конечный результат перевода;
  4. Отсутствие работы при переводе «по правилам»;
  5. Требуется мощное аппаратное обеспечение.

Система RBMT

  1. Возможность внесения изменений в исходный текст, следовательно, повышается качество переводимого текста;
  2. Не требуется мощное программное обеспечение;
  3. При переводе применяются грамматические правила;
  4. Предсказуемость результата перевода;
  5. Приемлемое качество перевода текстов общей тематики;
  1. Высокие требования к специальным знаниям со стороны простого пользователя;
  2. Требования к большим вложениям со стороны разработчиков;
  3. Избыток буквализма.

Из проведенного анализа видно, что система SMT уступает системе RBMT по ее потребности в больших вычислениях, которые требуют мощного аппаратного обеспечения, по простоте применения и буквальности перевода. Система RBMT в отличие от SMT не требуется мощное аппаратное обеспечение, обеспечивает приемлемое качество общего содержания переведенного фрагмента. Возможность использования внешних подключаемых словарей расширяет потенциал программы и особенно при работе со специальной лексикой.

Проведем анализ систем, используя конкретные переводческие программы: Google Translate (система SMT) и ПРОМТ (система RBMT). Для примера возьмем следующее предложение: «Meanwhile, we are holding your order aside with instructions to rush shipment as soon as we receive your payment». Перевод Google Translate: «Между тем, мы ведем Ваш заказ указанием в сторону спешить отгрузки, как только мы получим ваш платеж». Перевод ПРОМТ: «Тем временем мы держим Ваш заказ в стороне инструкциями срочно отправить отгрузку, как только мы получаем Вашу оплату». Как видно из исходного текста, сложность вызвал фразовый глагол hold aside (зарезервировать). Заменим слово синонимом reserve в той же временной форме. Перевод ПРОМТ: «Тем временем мы резервируем Ваш заказ с инструкциями срочно отправить отгрузку, как только мы получаем Вашу оплату». Замена глагола повлияла на результат, сделав перевод понятным.

Таким образом, система RBMT способна активизировать усовершенствованный вариант перевода, учитывая вносимые корректировки в исходный вариант.

Система RBMT является более удобной и практичной в применении. Качество перевода, сделанного при помощи системы SMT, полностью зависит от объема доступных ей корпусов. Переведенный текст напоминает работу переводчика – человека, но все же по качеству SMT уступает RBMT. Система RBMT в отличие от SMT не требуется мощное аппаратное обеспечение, обеспечивает приемлемое качество общего содержания переведенного фрагмента. Возможность использования внешних подключаемых словарей расширяет потенциал программы и особенно при работе со специальной лексикой. Сложность состоит в том, что расширение возможностей требует определенных навыков и больше времени пользователя при работе с программой.

В заключении можно прийти к выводу, что перевод - это сложный и многогранный вид человеческой деятельности. В настоящее время машинный перевод является важным направлением. Над созданием его программного обеспечения работают крупные компании. Результаты работы можно увидеть в широком практическом применении. Деятельность по преобразованию текста с одного языка на другой уже сложно представить без машинного перевода, он оказывает колоссальную помощь переводчику – человеку.

Используемая литература.

  1. Апокин и др. Чарльз Бэббидж. М., 1981;
  2. Кенжаев А. Д. Машинный перевод: история и современность // Иностранные языки и регионоведение. 2014;
  3. Комиссаров В. Н. Современное переводоведение: монография. М., 1999;
  4. Словари и системы машинного перевода [Электронный ресурс]: http//www.itland.com.ua/products/sect.php.section.
4.75
Ваша оценка: Пусто Средняя: 4.8 (4 голосов)

Все таки машинный перевод есть машинный перевод, который по качеству и точности всегда будет уступать "живым" переводчикам. Поэтому, я считаю, что труд таких специалистов как переводчики бюро переводов «ТрансЛинк» (http://www.t-link.ru/) всегда будет актуален.

Настройки просмотра комментариев

Выберите нужный метод показа комментариев и нажмите "Сохранить установки".