Основатели TASS Vision, iDos Games и Mystory о создании и развитии ИИ-продуктов

Недавно в нашем Telegram-канале The Tech состоялась прямая трансляция, посвященная теме искусственного интеллекта. В числе спикеров выступили основатели известных стартапов, которые поделились своими знаниями и опытом. Подробности и интересные моменты обсуждения в нашем материале.

Шахзод Умирзаков, CEO и сооснователь TASS Vision
Айдос Рыскельдинов, Founder и CTO iDos Games
Айтемир Мудинов, сооснователь Mystory

О себе и стартапе

Шахзод. Мы специализируемся на искусственном интеллекте и компьютерном зрении. Интегрируем наш продукт в видеокамеры магазинов или устанавливаем собственные умные камеры для проведения аналитики. Отслеживаем посещаемость и конверсию, определяем узкие места в торговом процессе. Наши алгоритмы помогают оптимизировать работу магазинов, повышая их эффективность и увеличивая объем продаж на 15%.

За последние 4 года мы внедрили нашу технологию в более чем 1300 сетевых магазинов. Среди клиентов — крупные ритейлеры, специализирующиеся на электронике, продуктах питания и модной одежде. Работаем в Казахстане, Кыргызстане, Узбекистане и Турции.

Айдос. Мы создаем экосистемную платформу для разработки блокчейн-игр и приложений с искусственным интеллектом. Ранее использовали ее как внутренний продукт для генерации кода, изображений и звуков для игр. Теперь превратили ее в отдельный сервис.

Айтемир. Мы разрабатываем терапевтические книги-сказки с помощью искусственного интеллекта, которые помогают детям восстановиться после психологических травм. Недавно начали работу в Турции, чтобы помочь детям, пережившим землетрясение. Наша цель — сделать счастливыми 10 миллионов детей. На данный момент выполнили около 2% от этой задачи.

Как работают ИИ-продукты

Шахзод. Когда офлайн-магазины открывают много филиалов, у них возникают проблемы с качеством обслуживания. Это приводит к падению конверсии. На e-commerce платформах доступно много инструментов для отслеживания трафика и поведения покупателей, но в физических магазинах их нет. Мы решаем эту проблему, оцифровывая деятельность офлайн-магазина. Наши ИИ-инструменты определяют, где именно возникают проблемы с конверсией и предлагают чек-лист действий для их устранения.

Мы используем модель распознавания лиц — face detection. Анализируем каждый кадр видео, чтобы определить, сколько людей посетило магазин и какие действия они совершили. Второй алгоритм мы обучили на базе из пяти миллионов лиц — он определяет возраст и пол в промежутке пяти лет с точностью в 94%.

Полученные данные синхронизируются с нашими серверами и интегрируются в дашборды для удобного отслеживания и анализа. После этого ИИ дает рекомендации для увеличения продаж. Также наш инструмент мотивирует продавцов и менеджеров, предоставляя им дополнительные возможности для заработка через комиссионные и бонусы на основе конверсии.

Айдос. Мы объединяем несколько готовых моделей — ChatGPT-4, Stable Diffusion и Dall-E. Дообучаем их на своих данных, чтобы получать нужные нам результаты.

Если раньше использовали эту технологию только в играх, то теперь обучаем ИИ-модели в разных областях, в зависимости от потребностей. Добавили функцию генерации звука по тексту. Расширили языковую поддержку до более чем 70 языков, включая казахский и русский. Работаем над новыми функциями вроде генерации видео. Интегрируем систему блокчейна, которая позволит покупать подписки через токены — их можно заработать в наших играх. Так создается замкнутая экосистема продуктов iDos Games.

Айтемир. В Mystory мы используем open source-модели, такие как ChatGPT, Stable Diffusion и другие. Также дообучаем их на собственных данных. Акцентируем внимание на моделях, которые генерируют изображения, чтобы обеспечить максимальную персонализацию. Делаем так, чтобы персонаж на картинке был похож на конкретного ребенка.

Для нас контент — это средство помощи. Ребенок может увидеть себя главным героем истории, в которой есть его близкие, родные, друзья. Дети легче воспринимают советы через картинки и истории — это помогает им преодолевать ментальные травмы.

Особенности и сложности создания ИИ-продукта

Шахзод. Построить software-компанию проще: если что-то идет не так, проблему можно быстро выявить и устранить. В нашем случае — в hardware-компании, ситуация сложнее: каждое изменение требует дополнительной проверки. Тестирование занимает больше усилий, ведь нужно учитывать много факторов: погода, сетевые настройки, внутренние конфигурации.
Мне хорошо запомнилась одна проблема — при обновлении через облако во многих локациях отключился интернет. Недообновленная прошивка вызвала сбой системы, который потребовал физического вмешательства для исправления.

Айдос. AI iDos Games — не основной проект компании. Поэтому сильных сложностей не было. Команда уже была сформирована. За недолгое время мы упаковали онлайн-сервис и выпустили его на рынок. Альфа-тестирование провели внутри компании. Пока больших ошибок или сложностей не возникало.

Айтемир. Для создания первой книги мы использовали Midjourney и ChartGPT. После нашли первых клиентов, начали общаться сними. В один момент поняли, что хотим помогать детям через наши книги. После акселерации от Astana Hub и Google for Startups, нам удалось увеличить выручку и найти инвестора. Тогда же столкнулись с трудностями при поиске специалистов по разработке софта, особенно в области искусственного интеллекта, Computer Vision, генеративных моделей.

Рынок кадров и развитие искусственного интеллекта

Шахзод. Во всем мире наблюдается нехватка кадров в области искусственного интеллекта. И хотя многие специалисты меняют квалификацию на ИИ-инженеров, компании не могут ждать. Особенно остро эта проблема ощущается в Центральной Азии. В нашем регионе мало профессионалов в области искусственного интеллекта. Это приводит к необходимости аутсорсинга квалифицированных кадров из других стран, таких как Южная Корея или Китай, где специалистов намного больше.

Институты с факультетами по искусственному интеллекту начали массово выпускать инженеров. Но разработка алгоритмов требует огромного объема данных. Это длительный и ресурсоемкий процесс, требующий времени.

Мы живем в эпоху Weak AI — слабого искусственного интеллекта. ИИ-системы способны решать ограниченное число задач, не обладая общей интеллектуальной способностью. Следующий шаг — развитие общего искусственного интеллекта. Тогда различие между ИИ и человеком станет неочевидным. В некоторых областях технологии уже превосходят человека, но нужно собрать все разработки вместе и двигаться дальше.

Айдос. В последнее время в мире происходят сокращения персонала, из-за широкого внедрения ИИ. В некоторых компаниях увольняют до 50% штата. Искусственный интеллект забирает на себя задачи, особенно в генерации графики и кодинге. Думаю, что тенденция продолжится, ведь ИИ позволяет компаниям экономить время и деньги. При этом точно останутся сотрудники, способные эффективно работать с искусственным интеллектом. Такой человек может быть гораздо продуктивнее, чем несколько других сотрудников вместе.

Для многих развитие ИИ — положительное явление. Но не следует забывать об обратной стороне медали. Технологии, созданные для блага, могут быть использованы мошенниками. Поэтому важно контролировать эту сферу.

Айтемир. Я активно использую искусственный интеллект в своей работе. В основном — для заполнения разных заявок. Это значительно ускоряет процесс: если раньше я тратил неделю, то теперь — два дня.

Я не строю предположений по поводу будущего развития ИИ, так как мнения по этому вопросу сильно расходятся.