Google Переводчик на некоторые последовательности символов отвечает очень своеобразными стихотворениями

переводчик

Пару дней назад специалист по машинному обучению и бывший сотрудник Google Дан Лу опубликовал в Twitter пост «Google Переводчик, ты в порядке?» Вопрос возник у Дана после того, как на последовательный ввод повторяющихся японских иероглифов инструмент отреагировал чем-то похожим на крайне своеобразную поэзию.

Пост быстро набрал популярность, и с переводчиком начали экспериментировать другие пользователи, предлагая свои варианты того, какое произведение пытается создать Google.

Типичную попсовую песню?

Сюжет для порнофильма?

Если копнуть глубже и попробовать выяснить, что заставляет переводчик «сходить с ума», мы обнаружим записи двухнедельной давности лингвиста Марка Либермана. В блоге он описывает сходные результаты перевода каскадного повторения небольших последовательностей символов на разных языках. По его словам, появление «стихотворений» объясняется использованием в переводчике архитектуры рекуррентных нейронных сетей с долгой краткосрочной памятью (LSTM).

А началось всё с поста на Reddit, на видео из которого и отреагировал Марк Либерман:

Предлагаем и вам поэкспериментировать.

Саша, дружелюбный биоробот