Skype Translator учит иностранные языки в социальных сетях

Технологии 18.06.2014

Skype Translator учит иностранные языки в социальных сетяхКогда Microsoft и Skype представили в мае автоматический переводчик Skype Translator многие выдохнули с облегчением – наконец то языковой барьер в общении будет преодолен. Если Скайп-Переводчик действительно сможет осуществлять синхронный голосовой перевод, значит, мы будем свободно общаться с друзьями и деловыми партнерами вне зависимости от того, на каком языке они говорят.

Это серьезный прорыв в области автоматизированных систем перевода, распознавания и синтеза речи. Но для превращения технологии, описанной в фантастических романах, в реальный продукт надо решить серьезные научные проблемы. Во многом они связаны с тем, что между письменной и устной речью человека существует заметная разница.

Тереза ??Чонг в IEEE Spectrum рассказала о том, как команда разработчиков Microsoft (Редмонд, штат Вашингтон), работающая над Skype Translator, расправляется с нашими «м-м-м», «ой», «знаете», «так-так» и подобными элементами, присутствующими в речи каждого человека. Хотя они и не имеют явного значения, но модифицируют эмоциональное и смысловое значение с казанное.

Чонг выделила основную проблему:

Разрыв между автоматическим переводом текста и речи связан с тем, что лучшие системы машинного перевода «обучены» с помощью огромного объема качественных текстовых материалов. Им не пришлось сталкиваться с неопределенностью на выходе систем распознавания речи, с которыми приходится иметь дело переводчику для Skype.

Microsoft использует традиционный подход, основанный на связях между одинаковыми по смыслу фразами на различных языках, но команда сделала дополнительный шаг и, на ряду с фразами, анализируется связь между отдельными словами. Это помогает преодолевать грамматические несоответствия между различными языками.

Но очень скоро команда поняла, что следует идти в социальные сети. Здесь каждая платформа, Facebook, Twitter и SMS имеют собственные особенности. Исследователи внедрили «платформу нормализации текстов из социальных систем», интегрировав ее с собственной системой, и это позволило улучшить качество перевода на 6%.

Это еще одно доказательство того, что социальные сети являются не только инструментом нашего общения и развлечения, но и ценным средством для исследований и разработок как в области социологии, так и высоких технологий. Остается лишь надеется, что Microsoft с пользой воспользуется партнерскими отношениями с Reddit, Imgur и Twitch, позволяющими исследователям заглянуть в генерируемые пользователями данные.

Добавить комментарий