AkylAI — первый AI-ассистент на кыргызском языке

Основатели стартапа AkylAI рассказали, как создавали первый AI ассистент на кыргызском языке. Подробнее читайте в нашем материале. 

Тимур Туратали, Нурсултан Бакашов, Улан Абдуразаков, город — Бишкек, основатели AkylAI

Как все началось

Мы начали работать вместе в 2022 году. У AkylAI три основателя: Улан Абдуразаков, Тимур Туратали и Нурсултан Бакашов. Вначале мы просто проводили свои курсы по Data Science и машинному обучению. Также мы основали AI-сообщество Кыргызстана. Это сообщество специалистов, занимающихся искусственным интеллектом, вокруг которого мы организовывали разные курсы.

В прошлом году у нас появилась идея о том, что цифровой мир развивается, и с приходом ChatGPT все сильно изменилось. На тот момент ChatGPT не знал кыргызского языка, и мы решили собрать языковой корпус — коллекцию слов и текстов для обучения модели.

Мы начали заниматься корпусом в мае 2023 года, и за три месяца собрали более 300 миллионов кыргызских слов. Нам помогали партнеры, включая Парк высоких технологий Кыргызской Республики, Кыргызско-Турецкий Университет Манас и Кыргызский Государственный Технический Университет.

Команда

После того, как собрали первый корпус, решили создать LLM на кыргызском на базе Llama. В августе 2023 года мы выпустили первую бета-версию AkylAI. Это был веб-сайт с чат-ботом, который отвечал на запросы на кыргызском языке. Изначально мы думали, что на этом остановимся.

Долго думали, как развить проект дальше. Заметили, что колонки «Алисы» стали популярными и решили создать свою колонку. В этом нас сильно поддержал Парк Высоких Технологий, предложив завершить проект AkylAI, а затем упаковать его в устройство. ChatGPT уже знает кыргызский и решает многие вопросы. Но идея создать устройство для дома, с которым можно общаться, нам понравилась. 

Hardware-частью начали заниматься в январе 2024 года. Сначала собрали команду. Первым нашли индустриального дизайнера — Олега Steel Drake Ярмакова, который начал заниматься дизайном и прототипированием. Также нашли электронщика Егор Гарающенко, который может собрать плату для устройства.

Одна из самых сложных задач — сделать так, чтобы модель разговаривала на кыргызском. Этот язык изначально не поддерживался, поэтому мы начали с нуля. Чтобы обучить модель записали более 24 часов текста с актрисой в студии. Сначала голос звучал с акцентом, но к апрелю мы смогли добиться нужного качества.

Мы сделали голос доступным в open source для поддержки сообщества и программистов. Теперь любой, кто захочет, сможет взять этот голос и код, использовать их своих целях. 

В июне мы презентовали первые пять прототипов, которые могут говорить и отвечать на вопросы. Работы еще много, но для нас важен первый шаг — когда было ничего непонятно и сложно, но мы справились.

Целевая аудитория 

У нас есть веб-версия с 15 000 пользователями. Она бесплатная и позволяет общаться и решать задачи на кыргызском языке. В дальнейшем мы видим AkylAI не просто помощником для дома, но настоящим компаньоном и другом, который всегда готов выслушать и дать советы. Что-то вроде психолога или терапевта.

Программы инкубации

В мае 2024 года прошли в американский акселератор Launch от Founder University Джейсона Калаканиса. Здесь представили проект с акцентом на ментальное здоровье и AI Buddy. Проходим акселерацию и готовимся к демо-дню в августе.

В прошлом году мы участвовали в программе Unicorn from KG от Парка Высоких Технологий, который выделил нам начальное финансирование. В ее рамках прошли месячное обучение от Draper University.

Парк Высоких Технологий поверил в нас даже больше, чем мы в себя. Поддерживали не только финансово, но и морально. Также хотим поблагодарить Европейский банк реконструкции и развития, EBRD. Мы участвовали в их программе Star Venture и стали победителями. Благодарим всех партнеров, кто нам помогал и верил в наш проект. Это не дело одного человека, а работа всей нашей команды.

Трудности

Обучать модели ИИ — это всегда непонятное дело. Ты не знаешь, какой результат получится, а это означает стресс. Так было с «Голосом». Мы тренировали его три-четыре раза, чтобы достичь хорошего уровня.

Вторая проблема — модульная часть, электроника. Мы производили все у нас, но заказывали из Китая. У нас была проблема с модулем из Израиля, где были сложности с логистикой. Пришлось перезаказывать через Китай.

Проблемы были с Hardware — загрузить модель в колонку так, чтобы они работали. Для сборки первой модели нам хватило кадров, а теперь нужны более опытные и квалифицированные специалисты.

Чтобы понимать масштабы: Amazon потратил на свою Alexa, по разным оценкам, $20 до $43 миллиардов, а «Алиса», по разным оценкам, обошлась примерно в $20 миллионов. Большая часть этих затрат, вероятно, ушла на человеческий капитал.

Ключевой навык стартапера — умение жить в неопределенности, когда ничего не ясно, не знаешь, получится продукт или нет. Учитесь принимать и наслаждаться этим состоянием. Важно не бояться неопределенности и находить в ней возможности. Самое тяжелое — это сделать первый шаг. 

Достижения

Считаем нашей победой создание первого кыргызского голосового ассистента. Это большое достижение не только для нас, но для всей страны. Проект был смелым, интересным и сложным. Не каждый осмелится на такое.

Мы прошли акселерацию Launh. Это круто, что мы, люди из Центральной Азии, можем создавать классные идеи для всего мира, даже находясь здесь. Главное — убрать рамки в голове.

Планы

Мы планируем выйти на американский рынок до конца этого года. Это важно, потому что нам нужны инвестиции и финансовые ресурсы. В Центральной Азии мало кто готов предоставить необходимое количество средств, а рынок здесь гораздо меньше. В США возможностей больше.

Мы уже представили наш американский продукт и сделали MVP, который тестируется фокус-группой. Наша цель — привлечь больше пользователей и параллельно дорабатывать колонку. К концу года завершим работу над колонкой, сделаем ее продуктом, готовым к производству на заводах.

Стартаперам желаю быть смелыми, идти вперед, пробовать. Fail and fail again until you succeed.