Искусственный интеллект от Yandex Cloud научился автоматически расставлять знаки препинания при распознавании речи

Yandex Cloud обновила Yandex SpeechKit — сервис для синтеза и распознавания речи. Теперь у пользователей появилась возможность автоматически расставлять знаки препинания при переводе голоса в текст. Такая функция идеально подойдет при общении с голосовым помощником, автоматическом транскрибировании или формировании субтитров. Текст, распознанный нейросетью, будет удобен для восприятия и максимально приближен к литературному.

Функция от Yandex SpeechKit получила название Пунктуатор и может работать как в реальном времени, распознавая речь голосовых помощников, так и при распознавании ранее записанных аудиофайлов. 

Разработан Пунктуатор с помощью двух последовательно работающих моделей машинного обучения. Первая переводит голос в текст, вторая расставляет знаки препинания в соответствии с нормами русского языка. 

Пуктуатор доступен для всех пользователей Yandex SpeechKit и настраивается стандартными средствами в API. Отмечается, что многие заказчики, сегодня используют Yandex SpeechKit для создания голосовых помощников с диалоговым интерфейсом. 

🎙“В таких проектах распознанный машиной текст важно сделать максимально приближенным к тому, как если бы его написал реальный собеседник. Пунктуатор решает эту задачу просто” — рассказал Василий Ершов, руководитель разработки Yandex SpeechKit.