Искусственный интеллект для перевода

Обновлено: 10.10.2024
Технологии машинного обучения нейросетей позволяют переводить тексты с использованием распознавания смыслов (а не только словари и статистические методы). Таким образом, существенно повышается качество переведенного текста. Примеры использования ИИ для переводов - приведены ниже.

2024. DeepL добавил большую языковую модель чтобы превзойти Google Translate



С момента своего запуска в 2017 году, DeepL успешно конкурирует с гигантом машинного перевода Google Translate. Теперь, с выпуском своей новой большой языковой модели (LLM), стартап стремится поднять стандарты в индустрии еще выше. Новая LLM специально разработана для перевода и позволяет создавать более человеческие переводы. В отличие от универсальных моделей, LLM не использует интернет для обучения. Вместо этого она использует собственные данные DeepL, специально адаптированные для создания контента и перевода. В обучении модели также участвовали эксперты по языкам, которые помогали улучшить качество перевода. DeepL утверждает, что их новая LLM превосходит Google Translate. Переводы, работающие на новой LLM, теперь доступны для пользователей DeepL Pro на четырех языках: английском, немецком, японском и упрощенном китайском. Пользователи могут активировать LLM на веб-переводчике, выбрав "модель нового поколения".


2023. Meta выпустила ИИ модель способную переводить около сотни языков



Meta представила нейросеть SeamlessM4T, которая может переводить около 100 языков (как в текстовом, так и в аудио-формате). В компании заявили, что собрали десятки миллиардов предложений письменного текста и 4 миллиона часов устной речи из интернета. Meta утверждает, что по результатам внутреннего теста она показала лучшие результаты против фоновых шумов по сравнению с современной современной моделью транскрипции речи. Также сообщается, что модель «чрезмерно обобщает формы мужского рода при переводе с нейтральных терминов» и лучше работает при переводе со слов мужского рода для большинства языков.


2023. Онлайн-переводчик DeepL представил ИИ-помощника Write для исправления ошибок в тексте



Немецкая компания DeepL выпустила бета-версию DeepL Write — ИИ-помощника для написания текстов на иностранном языке. Как и подобный сервис Grammarly, этот инструмент исправляет грамматические ошибки и предлагает варианты, чтобы улучшить стиль или подобрать более точные слова. Команда решила запустить инструмент, заметив, что пользователи часто переводят текст со своего языка на иностранный и обратно, чтобы отловить возможные ошибки. Следующий шаг развития инструмента будет заключаться в том, чтобы сосредоточиться не на содержании текста, а на «неуловимых тонах и формулировках».


2022. Facebook выложил в открытый доступ ИИ-технологию для перевода текстов на 200 языков



Марк Цукерберг рассказал, что его компания открыла исходных код ИИ-модели, которая может переводить текст на 200 языков. По его словам, у многоязычной модели более 50 млрд параметров, её обучали с помощью суперкомпьютера Research SuperCluster. Достижения в этой области позволят выполнять более 25 млрд переводов в день в приложениях компании, написал Цукерберг. Это часть проекта No Language Left Behind (NLLB), который компания анонсировала в начале 2022 года. В частности, модель NLLB-200 может выполнять «высококачественные» переводы на 55 африканских языков.


2020. В iOS 14 появился оффлайн-переводчик, выбор браузера, индикатор работающей камеры



Apple представил новую версию мобильной ОС iOS 14. Новая «Библиотека приложений» автоматически организует приложения по категориям ― как по папкам, только лучше. Также появится возможность скрывать целые экраны с приложениями на главной странице. В Apple Translate стало больше пар языков для перевода и возможность синхронного перевода, задействующая распознавание речи при помощи машинного обучения. Приложение может работать полностью оффлайн. Также, появился выбор браузера и почтового сервиса по умолчанию. До этого по умолчанию ссылки открывались только в Safari. Появилась возможность назначать различные команды на постукивание по задней крышке телефона. Появился индикатор работающей камеры или микрофона. Если какое-то приложение прямо сейчас использует вашу камеру, вы увидите в правом верхнем углу зеленую точку. Если использует микрофон — желтую.


2019. Google представила технологию синхронного перевода устной речи Translatotron



Google представила Translatotron - технологию синхронного перевода устной речи, которая не выполняет этап расшифровки речи в текст и обратно (как это делается в Google Translate), а анализирует спектограмму источника и генерирует спектограмму на нужном языке. Кроме этого, такая система может сохранять интонацию и паузы оригинальной речи. В Google выделяют несколько преимуществ Translatotron. Технология может быстрее совершать перевод (по сравнению с «каскадными» системами), избавляется от возможных ошибок при распознавании текста и может лучше справляться со словами, которые не нуждаются в переводе (например, названия и имена собственные).


2019. Google Assistant научился синхронному переводу для 27 языков, включая русский


Виртуальный ассистент Google Assistant теперь может помочь легче общаться с иностранными партнерами и клиентами. В нем появился режим синхронного перевода на 27 языков, в числе которых есть и русский. Первым устройством с его поддержкой стал умный дисплей Google Home Hub. Чтобы активировать функцию, нужно попросить Asisstant побыть переводчиком на выбранный язык. Пока переводчик работает не идеально, поэтому кроме синхронного перевода, вы получите еще и смешные смыслы, которые создадут более расслабленную атмосферу для общения с иностранными партнерами и клиентами (как показано в видеоролике).


2017. Google представил беспроводные наушники со встроенным переводчиком


На большой презентации, вместе с новым телефоном, ноутбуком и прочими штучками, Google представил беспроводные наушники Pixel Buds за $159, которые предназначены для более близкого общения со своим голосовым помощником Google Assistant. На первый взгляд, это всего-лишь жалкая пародия на Apple Airpods + Siri. Однако, у Гугла есть большое преимущество - переводчик, который переводит речь в реальном времени. А с новыми наушниками вы сможете проводить переговоры с зарубежными партнерами, как Президент. Зафиксированная встроенным микрофоном речь на иностранном языке (а поддерживаются 40 языков) будет воспроизводиться на русском в наушниках. А ваш партнер будет слышать у себя в наушниках синхронный перевод вашей речи.


2016. Google Translate начинает использовать смысл для перевода



До сих пор Google Translate использовал статистический метод перевода. Он разбивал предложение на фразы, и анализируя миллионы ранее сделанных переводов, определял наиболее вероятный перевод данной фразы. Это работает гораздо лучше дословного перевода, однако все еще значительно хуже человеческого перевода. Новая версия сервиса, основанная на технологии Neural Machine Translation, переводит не слова, и не фразы, а целые предложения. Т.е. система извлекает из предложения объекты, события и связи между ними, а затем выражает смысл на другом языке. Она состоит из двух 8-слойных нейросетей, анализирующей и синтезирующей.Между нейросетями установлен дополнительный модуль внимания, который контролирует, чтоб  не пропускались редкие, но важные для смысла предложения слова. На данный момент новый алгоритм работает с 9 языками: английским, французским, немецким, испанским, португальским, китайским, японским, корейским и турецким. В будущем добавится поддержка всех 109 языков. ***


2016. Facebook отказалась от Bing Translator в пользу собственного переводчика



Facebook уже несколько лет предоставляет возможность перевода постов на ваш язык. До сих пор эта функция осуществлялась с помощью майкрософтовского переводчика Bing Translator, но в Facebook решили от него отказаться и разработали свой. Говорят, что Bing подходит для официальных текстов, но плохо справляется с обычными человеческими писаками, наполненными ошибками и фразеологизмами. Очевидно, для обучения переводчика Facebook использует свою огромную базу сообщений пользователей, т.е. все что вы пишите на Фейсбуке может быть использовано в качестве перевода других постов.


2015. Технология машинного перевода ABBYY Compreno пытается понять естественный язык



Как известно, самый популярный в мире автопереводчик Google Translate работает на статистическом принципе: он обучается на миллионах готовых переводов и каждый новый текст переводит на основе сформированных на опыте паттернов. Иногда получается смешно, но в целом это работает. А вот конкурирующая фирма - компания Abbyy не стала искать легких путей. Она уже более 20 лет работает над технологией Compreno, основой которой является создание синтаксической модели языка и понимание смысла текста. Т.е. каждое предложение Compreno разбивает на объекты и, определяя связи между ними, сначала формирует универсальный перевод на язык смысла, а затем уже выражает этот смысл на другом языке.


2010. Как работает Google Translate


Как вы знаете, онлайн переводчик Google Translate уже умеет переводить не только отдельные слова, но и целые предложения и тексты. И если вы рассмотрите эти переводы, вы увидите, что переведенные слова не всегда идут в том же порядке, что и исходные: переводчик старается сгенерировать предложения с учетом смысла и правил языка. Как он это делает? Человеку для перевода нужны самые разнообразные знания о мире и о языке. Но Google Translate использует другой хак: он анализирует миллионы текстов и их готовые переводы, сделанные людьми и формирует паттерны из часто встречающихся фраз. Чем больше переводов он обрабатывает, тем качественнее становится его собственный перевод.