В Казахстане разработали масштабную ИИ-модель для распознавания тюркских языков
В Казахстане представили одну из крупнейших в регионе моделей искусственного интеллекта для автоматического распознавания речи на тюркских языках. Разработкой занимался казахстанский стартап Cybernet AI при поддержке Astana Hub и Министерства искусственного интеллекта и цифрового развития РК. Проект реализован с использованием GPU-инфраструктуры Microsoft.
Ключевая особенность решения заключается в том, что модель изначально разрабатывалась с учетом лингвистических особенностей тюркской языковой группы. В отличие от большинства существующих систем, которые создаются на базе англоязычных данных и затем адаптируются под другие языки, новая модель обучалась специально под региональные языки и речь реальных пользователей.
ИИ-система способна распознавать казахский, турецкий, узбекский, кыргызский, азербайджанский и татарский языки. Также она корректно работает со смешанной речью, в которой сочетаются тюркские языки и русский — формат, широко распространённый в повседневном общении, бизнесе и при обращении в государственные сервисы.
В Astana Hub отмечают, что запуск подобной технологии создает условия для масштабирования цифровых сервисов на родных языках стран тюркского мира. По словам представителей экосистемы, это позволяет повысить доступность ИИ-решений для бизнеса и государства, а также снизить зависимость от зарубежных технологий.
Разработчики подчеркивают, что модель устойчива к фоновому шуму, различным акцентам и переключению языков в рамках одного диалога. Это делает её применимой для контакт-центров, банков, телеком-компаний, сервисных организаций и государственных структур, где ежедневно обрабатываются большие объемы голосовых обращений.
В компании Cybernet AI заявляют, что проект является вкладом в развитие локальной ИИ-индустрии и технологического суверенитета региона. Создание собственных языковых моделей позволяет учитывать культурные и речевые особенности пользователей и повышать качество цифровых услуг.
Источник: Gov.kz
