Зачем бизнесу голосовые помощники и какими они станут в будущем

Мы познакомились с Алексеем Калинниковым, аккаунт-директором Yandex Cloud. Он рассказал о том, как работают речевые технологии, что они дают бизнесу и как развивается это направление на рынке Казахстана.

Что такое речевые технологии и как они работают

Речевые технологии — это технологии, основанные на машинном обучении. Они делятся на два направления: синтез и распознавание речи. Синтез — это преобразование текста в аудио, а распознавание — наоборот, перевод аудио в текст.

Нейросеть обучается на данных, которые в нее поступают. Есть разные технические показатели качества распознавания речи: WER, пропускная способность, возможность дообучения и другие. На практике качество модели можно оценить по тому, насколько хорошо она адаптируется под конкретную тематику: медицину, промышленность, финансы.

За что отвечает искусственный интеллект в голосовых помощниках

Искусственный интеллект может распознавать контекст и характер разговора: есть ли негатив, упоминаются ли какие-то даты, например, при записи к врачу.

Это важно и в процессе разговора оператора с клиентом, и для дальнейшего анализа. Yandex Cloud представил сервис речевой аналитики Yandex SpeechSense: он позволяет проводить детальный анализ звонков и чатов операторов контакт-центров, в том числе оценивать их тон и вовлеченность в диалогах.

Также модели могут автоматически определять язык — это особенно важно в странах, где говорят на нескольких языках. Речевые технологии Яндекса, применяемые в Yandex SpeechKit, позволяют понимать смешанную речь, когда в одном предложении используются слова из разных языков, а также синтезировать мультиязычную речь с помощью одной и той же речевой модели.

Кто выступает заказчиком речевых технологий

Речевые технологии позволяют улучшать клиентский опыт, повышать продажи и качество работы контакт-центра. Конкретные сценарии — это, например, исходящие телемаркетинговые кампании, информирование о записи на прием, допродажа продуктов и услуг. Поэтому заказчиками обычно выступают бизнес-подразделения.

Традиционно основной драйвер развития технологий — финансовые организации: банки, платежные шлюзы, криптобиржи. Технологичные решения нужны им, чтобы повышать безопасность, быстрее проводить операции, делать сервисы удобнее для пользователей и таким образом получать конкурентное преимущество.

Также активно используют речевые технологии те компании, у которых большая нагрузка на контакт-центры. Так, более 50% обращений в поддержку авиакомпаний касаются статуса рейса. Ответы на такие обращения можно автоматизировать.

Как быстро окупаются инвестиции в речевые технологии

Если правильно внедрить технологию, то возвраты можно увидеть достаточно быстро. При этом часто компании рассматривают это как инвестиции в будущее: даже если они не окупятся за один-три месяца, то в перспективе нескольких лет решение начнет приносить дополнительную прибыль. Плюс такие эффекты, как повышение лояльности и узнаваемости бренда, сложнее измерить в деньгах, чем показатели вроде ROI и TCO.

Важно и то, что порог входа снижается и внедрение речевых технологий уже не требует таких больших инвестиций, как раньше. С облачным решением можно тестировать гипотезы с минимальными вложениями и масштабировать их в случае успеха.

Какие результаты дает внедрение речевых технологий

По нашей статистике, голосовые роботы снижают нагрузку на контакт-центр не менее чем на 30%. При добавлении речевой аналитики можно повышать конверсию одного разговора на десятки процентов, подставляя нужные скрипты для сейлз-менеджеров во время звонка.

Как развиваются речевые технологии на рынке Казахстана

Многие казахстанские компании разрабатывают и успешно внедряют речевую аналитику и голосовых роботов. Качество этих решений также растет: хороший движок распознавания и синтеза, который лежит в их основе, является залогом успеха.

Если раньше таких роботов могли позволить себе только крупные компании, то сейчас порог входа настолько низкий, что даже небольшой таксопарк может автоматизировать входящие звонки, распределить их на водителей и быстро увидеть экономический эффект.

В Казахстане популярны такие сценарии, как автоматизация первой линии, телемаркетинговые кампании, опросы удовлетворенности.

Крупные компании работают и над собственными уникальными речевыми моделями. Думаю, в 2024 году мы услышим новые голоса, которые будут ассоциироваться с определёнными брендами.

Как будут развиваться голосовые помощники в ближайшие годы

Будет улучшаться качество синтеза и распознавания. Роботы будут становиться более гибкими в сценариях с пользователями: они смогут быть веселыми, грустными, говорить шепотом, использовать сленг и полностью адаптировать стиль общения под конкретного пользователя.

Доверие к голосовым помощникам будет расти: если раньше пользователи сразу просили переключить их на оператора, то постепенно все больше вопросов быстрее будет решить с роботом. Как говорит один из наших клиентов, хороший робот гораздо лучше плохого оператора.

Какие IT-специалисты в сфере речевых технологий сегодня востребованы

Традиционно продолжает расти спрос на разработчиков, ML- и DevOps- специалистов. Также в проектах по речевым технологиям обязательно должны участвовать аналитики, Project-менеджеры, редакторы, которые работают со скриптами.

Востребованными будут становиться специалисты, которые сочетают разные компетенции: бизнес-аналитика, консультанта, маркетолога, IT-специалиста, и также разбираются в финансовых показателях.