Нейронный машинный перевод

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Нейронный машинный перевод (англ. Neural Machine Translation, NMT) — подход к машинному переводу, в котором используется большая искусственная нейронная сеть. Он отличается от методов машинного перевода, основанных на статистике фраз, которые используют отдельно разработанные подкомпоненты[1].

Сервисы перевода компаний Google, Яндекс, Microsoft и PROMT[2] уже используют нейронный перевод. Google использует нейронный машинный перевод Google (GNMT) вместо ранее используемых статистических методов.[3] Майкрософт использует похожую технологию для перевода речи (в том числе в Майкрософт Переводчике и Skype Переводчике).[4] Гарвардской группой по обработке естественного языка была выпущена OpenNMT, система нейронного машинного перевода с открытым исходным кодом[5]. Яндекс.Переводчик имеет гибридную модель: свой вариант перевода предлагает и статистическая модель, и нейросеть. После этого технология CatBoost, в основе которой лежит машинное обучение, будет выбирать лучший из полученных результатов[6].

Модели NMT используют глубинное обучение и обучение признакам. Для их работы требуется лишь малая часть памяти по сравнению с традиционными системами статистического машинного перевода (SMT). Кроме того, в отличие от традиционных систем перевода, все части модели нейронного перевода обучаются совместно (от начала до конца), чтобы максимизировать эффективность перевода[7][8][9].

Двунаправленная рекуррентная нейронная сеть (RNN), также известная как кодировщик, используется нейронной сетью для кодирования исходного предложения для второй рекуррентной сети, также известной как декодировщик, которая используется для предсказания слов в конечном языке[10].

Примечания

[править | править код]
  1. Wołk, Krzysztof; Marasek, Krzysztof. Neural-based Machine Translation for Medical Text Domain. Based on European Medicines Agency Leaflet Texts (англ.) // Procedia Computer Science : journal. — 2015. — Vol. 64, no. 64. — P. 2—9. — doi:10.1016/j.procs.2015.08.456.
  2. Нейронные сети, офлайн-переводчики и конкуренция. Технологии машинного перевода. Дата обращения: 26 апреля 2019. Архивировано 26 апреля 2019 года.
  3. Lewis-Kraus, Gideon (2016-12-14). "The Great A.I. Awakening". The New York Times. Архивировано 5 мая 2017. Дата обращения: 21 декабря 2016. {{cite news}}: Указан более чем один параметр |accessdate= and |access-date= (справка)
  4. Microsoft Translator launching Neural Network based translations for all its speech languages – Translator. Дата обращения: 4 мая 2017. Архивировано 10 мая 2017 года.
  5. OpenNMT - Open-Source Neural Machine Translation (англ.). opennmt.net. Дата обращения: 22 марта 2017. Архивировано 16 марта 2017 года.
  6. В «Яндекс.Переводчик» встроили нейросеть с фантазией - CNews. Дата обращения: 8 октября 2017. Архивировано 8 октября 2017 года.
  7. Kalchbrenner, Nal; Blunsom, Philip. Recurrent Continuous Translation Models (неопр.) // Proceedings of the Association for Computational Linguistics. — 2013. Архивировано 23 ноября 2019 года.
  8. Sutskever, Ilya; Vinyals, Oriol; Le, Quoc Viet. Sequence to sequence learning with neural networks (неопр.) // NIPS. — 2014. Архивировано 29 апреля 2017 года.
  9. Kyunghyun Cho; Bart van Merrienboer; Dzmitry Bahdanau; Yoshua Bengio (3 September 2014). "On the Properties of Neural Machine Translation: Encoder–Decoder Approaches". arXiv:1409.1259 [cs.CL].
  10. Dzmitry Bahdanau; Cho Kyunghyun; Yoshua Bengio (2014). "Neural Machine Translation by Jointly Learning to Align and Translate". arXiv:1409.0473 [cs.CL].