Google Translate передбачив Друге пришестя

Один з користувачів сервісу Google Translate виявив, що при перекладі багаторазово написаного слова dog з мови новозеландських аборигенів маорі на англійський сервіс видає досить членороздільне передбачення Другого пришестя Ісуса Христа. Про це повідомляє The Next Web.


Класичний машинний переклад працює завдяки використанню безлічі паралельних корпусів (текстів мовою-джерелом і мовою-цілі). Такий переклад ще називають «статистичним» машинним перекладом, а останнім часом його також доповнюють використанням глибокого навчання, яке дозволяє враховувати контекст: наприклад, два роки тому Google зробили максимально точний машинний переклад з використанням нейромережі, а восени минулого року Яндекс представив свою «гібридну» версію перекладача.


Як гідністю, так і недоліком сучасних систем машинного перекладу є те, що перекладають вони всі: навіть ті слова, яких у мові немає. Зрозуміло, перекладач повідомляє користувача про помилку вихідного тексту, пропонуючи йому вибрати іншу мову; тим не менш, іноді такий переклад призводить до несподіваних результатів: як, наприклад, у випадку з монгольською, в перекладі з якого безліч «о» стає цілком осмисленим текстом.

Так само вийшло і з мовою маорі, в якій немає слова «dog»: Google Translate, отримавши на вхід кілька разів написане слово, переклав його англійською цілим реченням - передзнаменуванням про Друге пришестя Ісуса Христа і Кінець світу:

Doomsday Clock is three minutes at twelve We are experiencing characters and a dramatic developments in the world, which indicate that we are increasingly approaching the end times and Jesus’ return.

Годинник Судного дня показують без трьох хвилин північ. Ми переживаємо ознаки і суттєві зміни у світі, які вказують на стрімке наближення кінця часів і прихід Ісуса.

За словами The Next Web, їх джерело в Google повідомило, що текст не має сенсу і являє собою всього лише реакцію системи перекладу на безглуздий вихідний фрагмент. Релігійний ухил перекладу можна пояснити тим, що біблійні тексти - все ще найпопулярніше і найголовніше джерело для створення паралельних корпусів, особливо рідкісних. Минулого року німецькі лінгвісти навіть зібрали корпус, що складається з понад тисячі перекладів Нового заповіту.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND