Переводчик Microsoft научился понимать китайский текст не хуже человека

Новости Отредактировано

Нейронная сеть Microsoft научилась понимать китайский текст не хуже людей. Машинный перевод работает по принципам человеческого мышления.

2К открытий2К показов

Команда исследователей из Microsoft Research создала систему, которая переводит китайский текст на английский язык с такой же точностью, что и человек. Машинный перевод тестировался при помощи библиотеки новостных статей newstest2017. Консультанты со знанием обоих языков проверили результаты и подтвердили их высокое качество.

Новые методы обучения

Чтобы система понимала контекст предложений и выдавала естественно выглядящий результат, исследователи отказались от статистического машинного перевода. Вместо него была задействована нейросеть, повторяющая свои действия до получения хорошего результата. На такой подход исследователей вдохновила работа человеческого мозга.

Важную роль в создании нейросети сыграла техника Dual learning. Каждый раз, когда система превращала китайский текст в английский, исследователи переводили результат в обратном направлении. Это позволило системе взглянуть на свои ошибки и извлечь из них уроки.

Также нейросеть обучалась методом Deliberation networks: система множество раз переводила одно и то же предложение, постепенно добиваясь наилучшего результата.

Для улучшения точности перевода использовалась другая пара методов. Joint training подразумевает получение двух разных переводов английского текста на китайском языке. Полученные отрывки несколько раз переводятся в обратном порядке, что улучшает качество работы обеих систем.

Также в ходе обучения генерировался перевод текста слева направо и справа налево. Если в результате получается одинаковый результат, он считается более правильным.

Microsoft открыла страницу для демонстрации нейронного переводчика, а также опубликовала технический документ с подробностями о методах обучения.

Microsoft — далеко не первая компания, использующая нейросеть для машинного перевода. В марте 2017 года Google внедрила нейросеть Neural Machine Translation (NMT) в русский переводчик. В мае того же года Facebook представила инструмент fairseq для девятикратного увеличения скорости перевода текста на разные языки.

Следите за новыми постами
Следите за новыми постами по любимым темам
2К открытий2К показов