В Казахстане скоро появится первая национальная ИИ-модель

Искусственный интеллект открывает новые возможности для бизнеса, однако не все пользователи могут в полной мере воспользоваться его преимуществами. Большинство ИИ-систем разработаны для языков с высоким уровнем ресурсов, таких как английский, испанский или русский, что создает серьезный языковой разрыв и лишает многих, в том числе казахстанцев, доступа к передовым технологиям на их родном языке, необходимых для развития и улучшения жизни в странах с малоресурсными языками.

В Казахстане проблему языкового разрыва в ИИ решает научная рабочая группа под руководством Института умных систем и искусственного интеллекта при Назарбаев Университете — ISSAI NU. Они работают над созданием большой языковой модели KAZ-LLM, которая охватит ключевые для казахстанцев языки: казахский, русский и английский, чтобы каждый мог использовать цифровые технологии на своем родном языке. Эта фундаментальная модель станет основой для разработки местных сервисов и продуктов, так как будет опубликована в открытом доступе. 

Партнером в создании национальной большой языковой модели KAZ-LLM участвует цифровой оператор Beeline Казахстан и его дочерняя IT-компания QazCode. Это далеко не первый опыт оператора по разработке ИИ. Так, в прошлом году Beeline запустил и выложил в открытый доступ для всех разработчиков модель Kaz-RoBERTA-conversational,которая активно используется для обслуживания абонентов на цифровых платформах. На платформе Hugging Face ее скачали более 3000 раз.

Благодаря Beeline Казахстан и QazCode проект по созданию KAZ-LLM, курируемый ISSAI, обеспечен необходимой инфраструктурой. Компанией были предоставлены облачные вычислительные мощности объемом 8 DGX H100, что позволило существенно увеличить объем тренировочных данных и возможности обучения модели. Компания также предоставила собранные открытые данные, а дата-сайентисты QazCode присоединились к совместной рабочей группе по обучению модели.​

Этот вклад в развитие национальной большой языковой модели KAZ-LLM  отражает стратегию «цифрового оператора» Beeline, а также стремление преодолеть языковой разрыв в ИИ-технологиях. С этой целью оператор подписал Меморандум с суперкомпьютерным центром Барселоны, который специализируется на развитии ИИ разных языковых групп, а также анонсировал создание первого в Центральной Азии GPU облака для разработки AI-продуктов на базе технологии NVIDIA.