Постредактирование машинного перевода

М. С. Кузюков, студент НОУ ВПО «Омский юридический институт»

Научный руководитель: Бабалова  Галина Григорьевна,  профессор кафедры иностранных языков НОУ ВПО «Омский юридический институт», доктор филологических наук

Говоря о машинном переводе, следует учитывать, что компьютер не обладает разумом. Он не понимает языковых нюансов, намеков в тексте. Каждая новая конструкция, словосочетание, фразеологический оборот должны быть прямо предусмотрены программистом и занесены в программу.

В зависимости от стиля и назначения текста одно и то же слово нередко может иметь несколько значений. В наше время программа машинного перевода способна распознать стиль текста и, в зависимости от этого, выбрать нужный словарь. Также, программа сама может предлагать на выбор переводчику несколько вариантов перевода.[1]

В основе работы программы-переводчика лежит алгоритм перевода – последовательность однозначно и строго определенных действий над текстом для нахождения соответствий в данной паре языков. Наиболее распространенной является следующая последовательность операций анализа исходного текста:

1. На первом этапе происходит поиск входных словоформ в словаре языка исходного текста.

2. Следующий этап включает в себя перевод идиоматических словосочетаний, фразеологических оборотов.

3. Окончательный грамматический анализ, в ходе которого доопределяется необходимая грамматическая информация с учетом особенностей языка, на который переводится текст.

4. Синтез выходных словоформ и предложения в целом на выходном языке.[2]

Среди множества онлайн-переводчиков следует выделить PROMT и Google. Данные программы использованы для сравнительного анализа.

Чтобы понять принципы действия и качество использования словарей и анализа грамматики, а также качество перевода, был переведен текст. Перевод проводился в англо-русском направлении (текст объемом в 51 слово).

При анализе было использовано 2 критерия: 1) правильность подбора системой значения слов (уровень лексики), 2) правильность согласования слов в предложении (уровень грамматики, согласование слов в предложении в роде, числе, лице, падеже, а также пунктуация).

Возьмем в качестве первого примера следующий отрывок текста:

"It would be hard to imagine a more evil piece of work than Robert Alton Harris. After a lifetime of vicious, random crime, in 1979 in California he murdered two teenage boys in cold blood for their car. As he drove away, he finished off the cheeseburgers they had been eating."

Перевод, выполненный системой автоматического перевода PROMT:

"Было бы трудно вообразить более злую обрабатываемую деталь чем Роберт Алтон Харрис. После целой жизни порочного, случайного преступления в 1979 в Калифорнии он убил двух подростков хладнокровно для их автомобиля. Когда он уезжал, он завершил чизбургеры, которые они ели"

Система успешно справилась с поиском эквивалента английскому "in cold blood". Обращаем внимание на "обрабатываемую деталь". Эта ошибка вызвана, как легко понять, многозначностью слова "piece" и "work". Кроме того, абсолютно неправильно было перевести "для их автомобиля".

Более того автор текста в смысле первого предложения относится к детали, человек никогда бы не перепутал одушевленное и неодушевленное. Фразу "finished off the cheeseburgers " PROMT перевёл как "завершил чизбургер". Но в русском языке данное словосочетание  будет недопустимым. Существенным недостатком является то, что в выходном языке порядок слов почти всегда такой же, как и во входном.

Перевод, выполненный онлайн-переводчиком Google:

" Было бы трудно представить себе большее зло, часть работы, чем Роберт Альтон Харрис. После целой жизни порочного, случайные преступления, в 1979 году в Калифорнии он убил двух подростков в холодной крови для их автомобиля. Когда он уехал, он прикончил чизбургеры они ели"

В отличие от PROMT Google не перевёл идиому "in cold blood" и выдал для перевода "в холодной крови", т.е. использовал пословный перевод. Также Google повторил ошибку PROMT в переводе "for" как "для". Вместо использованного предыдущей программой "завершил чизбургер" Google использовал "прикончил", что ничем не лучше.

В англо-русском переводе онлайн-программа PROMT совершила 6 ошибок (2 лексических и 4 грамматических). А система Google в свою очередь допустила 6 ошибок (3 лексические и 3 грамматические).

Из данного исследования следует, что наименьшее число ошибок в переводе с английского на русский было допущено системой PROMT.

Выполнив анализ работы вышеназванных современных систем машинного перевода, мы увидели, что у каждой системы машинного перевода есть свои сильные и слабые стороны. На данном этапе системы машинного перевода не могут существовать без человека, поскольку мы увидели не безупречность их перевода. Поэтому, если мы хотим получить качественный перевод, то без постредактирования человеком не обойтись.

Литература:

  1. http://comp.potrebitel.ru/?action=model_list&num_id=71&cat_id=669
  2. http://study-english.info/article065.php Тараскин А. А. 2005 г.
4.75
Ваша оценка: Пусто Средняя: 4.8 (8 votes)

Довольно полезная и интересная статья.

Настройки просмотра комментариев

Выберите нужный метод показа комментариев и нажмите "Сохранить установки".