Линки доступности

Google-переводчик «вернул к власти» Мубарака


Страница Google с переводом на арабском языке «Я буду уважать президента Хосни Мубарака»
Страница Google с переводом на арабском языке «Я буду уважать президента Хосни Мубарака»

Ошибку в переводе компания объясняет сбоем алгоритма самообучающейся программы

Пока Египет ждет оглашения результатов президентских выборов, сбой в системе переводчика Google привел к «возвращению» Хосни Мубарака.

При введении фразы «I will respect Egypt's future president» («Я буду уважать будущего президента Египта») переводчик Google выдает предложение на арабском языке «Я буду уважать президента Хосни Мубарака».

Однако Мубарак, который из-за серьезных проблем со здоровьем находится на искусственном дыхании, не будет новым президентом Египта. В то же время, на фоне усиления власти его военных соратников и заявлений египетских революционеров о «перевороте», неожиданное появление Мубарака в Интернете вызвало волну подозрений и недоверия в Twitter и Facebook.

«Люди воспринимают речь, понимая значение слов. Мы знаем, кто такой президент, и что его как-то зовут. Переводчик Google не воспринимает семантику языка»
Джейсон Фрейденфельдс, представитель Google.

Что же это было? Заговор сторонников режима Мубарака? В Google говорят, что нет. Представитель Google Джейсон Фрейденфельдс заявил, что это просто сбой в алгоритме, который используется для понимания и перевода с одного из 64 языков на другой.

Программа полностью автоматизирована и самообучается, анализируя, как переводятся на другие языки слова и фразы в текстах, размещенных в Интернете.

То есть, когда переводчик Google «шерстит» Интернет в поисках ссылок на «президента Египта», то чаще всего в арабских текстах эта фраза идет вместе с упоминанием Хосни Мубарака.

При этом качество перевода зависит не столько от распространенности языка в мире, сколько от того, насколько он представлен в Интернете.

«Что касается английского и испанского языка, то в сети есть огромная масса переводов, – говорит Фрейнденфельдс. – Поэтому качество перевода правильно построенных фраз довольно высокое».

Кроме того, добавляет представитель Google, имеет значение разница в структурах между двумя языками:

«Во французском и испанском можно переставлять местами прилагательные и существительные. Этот нюанс машина-переводчик может усвоить без особых проблем. Но если при переводе нужно перенести слово в конец предложения, то научиться этому системе гораздо сложнее».

Для таких языков, как арабский, переводчику Google потребуется некоторое время, чтобы уяснить изменения, происходящие в реальном мире.

«Люди воспринимают речь, понимая значение слов. Мы знаем, кто такой президент, и что его как-то зовут. Переводчик Google не воспринимает семантику языка», – говорит Фрейнденфельдс.

Можно ли научить программу понимать такие языковые тонкости? Все зависит от группы инженеров и исследователей интернет-компании. Как только им удастся понять, на чем сбивается программа, они не будут менять эту единственную фразу, а попытаются усовершенствовать весь алгоритм.
XS
SM
MD
LG