Сравнительный анализ

«Цифровизация очень скоро освободит нас от переводов. Благодаря использованию нейронно-сетевых технологий, качество переводов буквально от месяца к месяцу существенно улучшается. Функция запоминания позволяет машине выбрать из большого числа вариантов тот перевод, который наиболее близок к правильному. Сейчас это становится реальным. Естественно-научные статьи уже можно не переводить. Нажали кнопку — автомат выдает перевод».

Академик, вице-президент РАН Алексей Хохлов

И это еще не самое интересное, что можно услышать про машинный перевод (machine translation, MT) – особенно от тех, кто, как вышеназванные лица, ничего не смыслит в этом вопросе. На Западе так и вообще почти всех уже убедили, что МТ – это «стильно, модно, молодежно», и не пользоваться им – признак отсталости. Но как обстоят дела на самом деле?

Над машинным переводом ученые и программисты бьются лет семьдесят. При этом, особенно в последние годы, направляемые на решение этой задачи ресурсы чудовищно превышают ее объективную важность. От оплаты труда «белковых» переводчиков еще ни одна фирма не разорилась, более того – за исключением контор типа AliExpress такие затраты редко превышают доли процента в общих расходах предприятия. Но по-прежнему как грибы после дождя растут новые движки машинного перевода. Пришло время задать простой вопрос – «зачем?»

Разумеется, есть ряд (довольно ограниченный) областей применения, в которых МТ вполне справляется. Скажем, можно настроить систему на основе правил, и она будет практически безошибочно переводить стандартные тексты типа сертификатов, личных документов, типовых договоров и пр. Аналогично можно натренировать нейронную сеть на корпусе исходных и переведенных текстов и получать вполне приличные результаты при переводе аналогичных текстов. Это – вполне оправданные области применения МТ. Однако зверь зачем-то вырвался из клетки и полез решать несвойственные ему задачи – МТ сегодня пихают везде. Качество, разумеется получается катастрофическим. Понимая это, апологеты МТ на пару с дефективными эффективными менеджерами выдвинули концепцию постредактирования машинного перевода (РМЕТ). Мол, МТ уже все сделал на 90%, а живому переводчику там «только чуть подправить». Ну и платить такому пока еще живому переводчику (долго с таким заработком он точно не протянет), соответственно, надо процентов 10…15 от ставки за перевод.

Укрупненные этапы перевода:

Укрупненные этапы РЕМТ:

Число действий увеличивается практически вдвое. Соответственно, никакого прироста производительности РЕМТ, если делать его качественно, дать не может. Перевод «с нуля» человеком оказывается быстрее и эффективнее. Об этом же свидетельствуют и отзывы коллег: на РЕМТ уходит на 20…60 % времени больше, чем на «просто перевод». То есть с точки зрения переводчика овчинка совершенно не стоит выделки. Однако вот с точки зрения менеджера БП или заказчика ситуация получается просто шикарная: человек работает в 1,5 раза интенсивнее при снижении оплаты на 60…80%! Рабовладельческий строй отдыхает J Ну и простой вопрос: а насколько качественно бедный переводчик будет делать РЕМТ на таких условиях? Ответ очевиден.

Итак, гипотеза первая. «МТ по любой технологии НИКОГДА не сможет правильно переводить специализированные тексты». И это не вопрос алгоритмов, Big Data, обучения нейронных сетей… Это принципиальная невозможность – такая же, как невозможность постройки вечного двигателя. Доказательство принципа: Специализированный перевод не может быть текстоцентричным. Для правильного понимания смысла текста необходимо привлекать огромные объемы дополнительной информации, причем чаще всего представленной в графическом виде, вообще не поддающемся машинному анализу. В самом исходном тексте, как правило, содержится не более 20…30% всей требуемой для перевода информации. Кроме того, исходный текст очень часто содержит грубые ошибки, исправлять которые – прямая обязанность переводчика. На это МТ, разумеется, также не способен. И это принципиально и никак не изменится от совершенствования технологий МТ. Любая такая технология работает только с исходным текстом. МТ не может заглянуть в иллюстрацию к научной статье по теме, чтобы понять, как надо переводить. Ничего понять он, кстати, тоже не может.

Пример. Вроде бы элементарный исходник, речь о колесном погрузчике: Less fuel is consumed in the use of V shape loading.

Как справились движки машинного перевода?

DeepL:  При использовании нагрузки V-образной формы расходуется меньше топлива.

GT: Меньше топлива расходуется при использовании V-образной загрузки.

Яндекс.Переводчик: Меньше топлива потребляется при использовании V-образной загрузки.

Все три варианта — гладкие, грамматически верные... и абсолютно бессмысленные. Потому как из текста (спасибо, дорогой автор!) совершенно невозможно понять, что имеется ввиду под «V shape loading». А вот если погуглить статьи на эту тему и посмотреть иллюстрации, то все становится на свои места. И правильный перевод будет «загрузка самосвала с движением колесного погрузчика по V-образной траектории». И никакой нейронной сетью его выловить невозможно в принципе - он не в тексте, он в картинках (рис. 1), а картинка к тому же не в этом тексте, а совсем в другом. И это очень частое явление в техническом переводе, кстати, уже не говоря про аудиовизуальный, где видеоряд имеет абсолютный приоритет.

решение задачи

Рис. 1 – Решение загадки про V-образную траекторию.

Поэтому применение МТ в специализированных видах перевода (технический, юридический, аудиовизуальный и не дай бог медицинский) – опасная глупость. На выходе будет красивая, гладкая, складная ахинея.

Троицкий Дмитрий Игоревич - руководитель и владелец агентства переводов и разработки программного обеспечения TTS, работал в АО «Атомэнергопроект». В настоящее время также ведет курсы перевода («Машиностроительный перевод», «Перевод в науке и образовании», «Борьба с Runglish», «Автоматизация труда письменного переводчика» и др.) в школе переводчиков и в университетах страны.

Источник: https://ai-news.ru/2020/02/blesk_i_nisheta_mashinnogo_perevoda.html

Гипотеза 2. машинный перевод отдельных и разных по сложности предложений с немецкого языка на русский. Сделана попытка выявить преимущества и недостатки нескольких онлайн сервисов, представляющих услуги по переводу.

Ключевые слова: машинный перевод, автоматический перевод, автоматизированный перевод, онлайн сервис

Advantages and disadvantages of the machine (computer) translation on the example of popular online translators

Kadnikova Oksana Vladimirovna
Ph.D of Philology, associate professor, Kemerovo institute (branch) of Plekhanov Russian University of Economics, Russian, Kemerovo
Kramarenko Vitaly Alexandrovich
Student of the department of Economics, Kemerovo institute (branch) of Plekhanov Russian University of Economics, Russian, Kemerovo

Abstract: The article considers the machine translation of separate sentences of various level of complexity and style from German to Russian. There is an attempt in the article to identify the advantages and disadvantages of several online translation services.
Keywords: machine (computer) translation, automated translation, online service

На сегодняшний день вычислительная техника помогает облегчить жизнь человека во многих сферах его деятельности. Она оптимизирует нашу работу, помогая снизить как физические, так  интеллектуальные затраты. Кроме того, результаты опросов показывают, что большинство пользователей используют компьютеры именно для работы[1], [2]. Процесс перевода текста так же не стал исключением.

Существуют  программные продукты и онлайн сервисы, которые относятся к области так называемого машинного перевода. Это всевозможные программы или сайты, которые в той или иной степени предоставляют услуги машинного перевода. «Машинный перевод – это выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия»[3].

При машинном переводе возможны следующие формы взаимодействия ЭВМ и человека:

  • с постредактированием. Исходный текст переводится машиной, а человек редактирует полученный результат.
  • с предредактированием. Сначала человек перерабатывает текст к последующей обработке машиной. При этом он максимально упрощает текст, заменяя сложные слова синонимами и устраняя возможные неоднозначные прочтения.
  • с интерредактированием. Исходный текст переводится машиной, но при этом человек вмешивается в ее работу и разрешает трудные случаи.
  • смешанные системы.

Вместо слова «машинный» часто употребляется слово «автоматический», что не искажает смысл. Однако термин «автоматизированный перевод» имеет другое значение – при нём программа помогает человеку переводить тексты, но не переводит их полностью за него.

Автоматизированный перевод имеет такие формы взаимодействия с человеком:

  • частично автоматизированный перевод. Например, человек использует при переводе компьютерные словари.
  • системы с разделением труда. Компьютер запрограммирован переводить фразы только жёстко заданной структуры. Все, что не соответствует этой структуре, возвращается на перевод человеку[4].

Машинный перевод имеет, как и очевидные преимущества, так и недостатки.

Первое преимущество – это высокая скорость перевода. Всего несколько секунд, и машинный перевод текста готов. Вам не придется часами листать словари для перевода каждого слова или тратить время на ожидание перевода от профессионального переводчика.

Следующим преимуществом машинного перевода является относительная дешевизна. Существует множество онлайн переводчиков, которые предоставляют свои услуги бесплатно. В то время как услуги профессионального переводчика стоят денег.

Доступность – еще одно преимущество машинного перевода.  Каждый, кто имеет доступ к интернету или установит офлайн версию машинного переводчика, может в любое время из любого места обратиться к нему и получить перевод.

Четвертым  преимуществом машинного перевода  является универсальность. Машинные переводчики обычно могут  переводить текст практически с любого языка на любой другой язык. В то время как профессиональные переводчики чаще всего специализируется на одном или нескольких языках.

Основной же недостаток машинного перевода – это низкое качество. Сервисы автоматического перевода в большинстве своем переводят текст дословно, без понимания информации и учета контекста. Они могут передать общую суть текста, однако, допускают лексические и грамматические  ошибки. В некоторых случаях смысл отдельного предложения или даже всего текста может вовсе исказиться после перевода.

Машинный перевод не может учитывать контекст и решить, как поступить в неопределенных ситуациях. В то время как профессиональный переводчик может проанализировать контекст и использовать свой опыт.

Приведенные выше преимущества и недостатки использования машинного перевода выявлены без учета языка перевода.  Мы решили проверить их на практике. Для этого оценим качество и сравним результаты перевода четырех наиболее популярных онлайн переводчиков: «Google переводчика», «Яндекс переводчика», «переводчика PROMT» и  «Microsoft Translator». Интерфейсы данных переводчиков просты и похожи: перед нами два поля, в одно из которых вставляется или вводится текст, а в другом отображается результат перевода, который прямо в нем можно отредактировать (рисунки 1-4). Языки перевода выбираются в выпадающих списках. С помощью вышеупомянутых сервисов переведем предложения различной сложности с немецкого языка на русский язык. Результаты  сравним с переводом, сделанным нами.

Рисунок 1. Интерфейс онлайн сервиса «Google переводчик»

Рисунок 2. Интерфейс онлайн сервиса «Яндекс переводчик»

Рисунок 3. Интерфейс онлайн сервиса «переводчик PROMT»

Рисунок 4. Интерфейс онлайн сервиса «Microsoft Translator»

Для начала, переведем с помощью онлайн переводчиков простое предложение. В нижеследующей таблице 1 представлено простое повествовательное предложение на немецком языке и варианты его перевода нами и исследуемыми онлайн переводчиками.

Таблица 1. Результаты перевода простого повествовательного предложения с немецкого языка на русский

Исходное предложениеFür dieses Wochenende planen wir einen Theaterbesuch.
Перевод, сделанный намиНа эти выходные мы планируем  посещение театра.
Перевод, предоставленный сервисом «Google переводчик»В этот уик-энд мы планируем посетить театр.
Перевод, предоставленный сервисом «Яндекс переводчик»На эти выходные мы планируем посещение театра.
Перевод, предоставленный сервисом «переводчик PROMT»Для этих выходных мы планируем посещение театра.
Перевод, предоставленный сервисом «Microsoft Translator»На эти выходные мы планируем посетить театр.

Проанализируем полученные переводы. Перевод, предоставленный сервисом «Яндекс переводчик» полностью передал смысл предложения и не допустил ни грамматических, ни лексических ошибок. Кроме того, этот перевод полностью соответствует переводу, сделанному нами.

Перевод, предоставленный сервисом «Microsoft Translator» отличается только одним: вместо существительного «посещение», что соответствует языку оригинала, сервис использовал глагол «посетить». Смысл предложения не искажен.

«Google переводчик» также передал смысл текста, однако слово «выходные» заменил менее уместных в данном контексте синонимом «уик-энд». «Переводчик PROMT» показал результат хуже других. Предлог «für» он перевел  «для», хотя в этом контексте предлог переводится как «на».

Переводы простого предложения онлайн переводчиками оказались в большинстве своем приемлемыми, рассмотрим переводы более сложного предложения.

В таблице 2 представлено немецкое предложение, осложненное инфинитивной группой, а также варианты его перевода нами и исследуемыми онлайн переводчиками.

Таблица 2. Результаты перевода предложения, осложненного инфинитивной группой

Исходное предложениеDie steigenden Börsenkurse und der höhere Wert Häuser bewegten die Menschen dazu, einen größeren Teil ihrer Einkommen zu verbrauchen und weniger zu sparen.
Перевод, сделанный намиРост цен на фондовой бирже и возросшая стоимость жилья вынудили людей расходовать большую часть своих доходов и меньше откладывать.
Перевод, предоставленный сервисом «Google Переводчик»Растущие цены на фондовом рынке и более высокие дома стоимость переместили людей потреблять большую часть своих доходов и экономить меньше.
Перевод, предоставленный сервисом «Яндекс переводчик»Растущие котировки акций и более высокая стоимость дома двигались люди склонны потреблять большую часть своих доходов и экономии меньше.
Перевод, предоставленный сервисом «переводчик PROMT»Растущие биржевые курсы и более высокая стоимость дома двигали людей, чтобы расходовать большую часть ее доходов и экономить меньше.
Перевод, предоставленный сервисом «Microsoft Translator»Рост цен на акции и более высокие значения домов переехали людей потреблять большую часть своих доходов и сохранить меньше.

Как видно из таблицы, ни один из онлайн переводчиков не смог корректно перевести данное предложение. Переводчики перевели отдельные слова и некоторые словосочетания, допустили много ошибок.

Рассмотрим перевод сложноподчиненного предложения с придаточным определительным. В таблице 3 представлено сложноподчиненное предложение на немецком языке и варианты его перевода нами и исследуемыми онлайн переводчиками.

Таблица 3. Результаты перевода сложноподчиненного предложение с придаточным определительным

Исходное предложениеÜblicherweise wird eine Drehung eines Lenkrads über eine Lenkwelle auf ein Zahnrad übertragen, welches mit einer Zahnstange im Eingriff steht.
Перевод, сделанный намиОбычно вращение рулевого колеса через вал рулевого управления передается на шестерню, которая находится в зацеплении с зубчатой рейкой.
Перевод, предоставленный сервисом «Google переводчик»Традиционно, вращение рулевого колеса через рулевой вал передается на шестерню, которая находится в зацеплении с зубчатой рейкой.
Перевод, предоставленный сервисом «Яндекс переводчик»Как правило, вращение рулевого колеса передается через рулевой вал на Шестерне, которая находится с одной шестерни в зацепление.
Перевод, предоставленный сервисом «переводчик PROMT»Как правило, перенесет вращение рулевого колеса о рулевой волне на шестерню, которая стоит с жердью зуба во вмешательстве.
Перевод, предоставленный сервисом «Microsoft Translator»Как правило вращение рулевого колеса на axle управления рулем передается на механизм, который доступен с стойку в интервенции.

С этим предложением лучше всех справился «Google переводчик». Он не исказил смысл предложения. Стоит только заменить слово «традиционно», на «обычно» или «как правило», и перевод станет вполне корректным.  «Яндекс переводчик» передал смысл предложения, однако допустил несколько ошибок. Хуже других справились «переводчик PROMT» и «Microsoft Translator». Они исказили смысл предложения и неправильно перевели некоторые слова. Это связано с тем, что перевод осуществлялся без учета контекста. Однако у сервиса «переводчик PROMT» можно указать тематику перевода. Выбрав тематику – «Техника: Автомобили», качество перевода немного улучшилось, но все равно оставляет желать лучшего: «Как правило, перенесет вращение рулевого колеса о рулевом вале на зубчатое колесо, которое стоит с зубчатой рейкой в зацеплении». Таким образом, со сложноподчиненным предложением справился хорошо только один переводчик из четырех.

Чтобы добиться более корректного перевода при использовании сервисов машинного перевода, следует придерживаться нескольких правил:

  • Во-первых, желательно максимально упрощать предложения, заменяя сложные слова синонимами. Сложные предложения, предложения с причастными оборотами, инфинитивными группами следует разбить на несколько отдельных, простых предложений.
  • Во-вторых, нужно стараться не использовать слова, которые являются многозначными. В противном случае велика вероятность разночтений.
  • В-третьих, желательно проверить текст, который требуется перевести, на наличие ошибок и опечаток. Не все сервисы машинного перевода могут отслеживать ошибки.

Проанализировав и сравнив переводы онлайн переводчиков, мы еще раз убедились в приведенных ранее достоинствах и недостатках машинного перевода. Таким образом, машинный перевод может помочь в понимание общего смысла текста, но он не способен предоставить грамотный, красивый, перевод и заменить полностью человека. Поэтому использовать или не использовать сервисы машинного перевода, зависит от информации, которую необходимо перевести, и качества, которое требуется от перевода.

Источник:https://scipress.ru/philology/articles/preimushhestva-i-nedostatki-mashinnogo-perevoda-na-primere-populyarnykh-onlajn-perevodchikov.html

В современном интернете более 630 миллионов сайтов, но лишь 6% из них содержат русскоязычный контент. Языковой барьер – главная проблема распространения знаний между пользователями сети, и мы верим, что решать её нужно не только обучением иностранным языкам, но и с помощью автоматического машинного перевода в браузере.

Сегодня мы расскажем читателям Хабра о двух важных технологических изменениях в переводчике Яндекс.Браузера. Во-первых, перевод выделенных слов и фраз теп%D