В Казахстане в открытом доступе опубликована первая национальная языковая модель на базе искусственного интеллекта IrbisGPT
В Казахстане стала доступна первая национальная языковая модель с открытым исходным кодом IrbisGPT, обученная на большом наборе данных на государственном языке. Разработчики опубликовали официальный релиз на популярном ресурсе Habr.com. Теперь каждый казахстанец сможет протестировать языковую модель и сделать свой вклад в ее обучение на казахском языке.
IrbisGPT — общественная некоммерческая инициатива, разработанная в сотрудничестве с MOST Holding и Gen2b.ai, студией, специализирующейся на применении искусственного интеллекта в бизнесе.
В сравнении с предрелизом, который был опубликован весной, актуальная версия IrbisGPT демонстрирует отличный потенциал для обучения. По словам разработчиков, подобные опенсорсные модели либо пытаются ответить на английском, либо просто «сыпят» случайными словами на казахском, но благодаря длительному обучению национальная языковая модель на вопросы без контекста отвечает достаточно развернуто и правильно. Так, IrbisGPT дает ответы на государственном языке на вопросы «шөп неге жасыл», знает кто президент Казахстана и сколько дней в году, и даже может пофилософствовать о смысле жизни.
Итоговый словарь токенизатора содержит более 60 000 токенов. У команды имеется план по созданию модели в более совершенной архитектуре, которая будет полезна в различных отраслях.
Скачать предобученную модель можно по ссылке.