Z.ai выпустила GLM-5.2 — бесплатную модель, которая конкурирует с GPT-5.5 и Claude
Z.ai выпустила GLM-5.2 — новую флагманскую модель для сложных задач программирования. Она работает с контекстом до одного миллиона токенов, распространяется бесплатно под лицензией MIT и по ряду ключевых тестов обходит GPT-5.5. Разбираемся, что умеет модель и чем она отличается от конкурентов.
Что такое GLM-5.2
GLM-5.2 — новая флагманская модель китайского стартапа Z.ai, ранее известного как Zhipu AI. Модель создана не для обычного общения, а для долгосрочных технических задач: масштабной разработки кода, автоматизированных исследований, оптимизации производительности и сложной отладки.
Главная проблема, которую решает GLM-5.2, — это надежность на длинной дистанции. Большинство моделей теряют нить задачи, когда работа растягивается на часы и десятки шагов. GLM-5.2 создавалась именно для того, чтобы этого не происходило.
Почему миллион токенов — это важно
Контекстное окно — это объем информации, который модель держит в памяти одновременно. У GLM-5.2 оно составляет один миллион токенов — в пять раз больше, чем у предыдущей версии GLM-5.1.
На практике это означает, что модель способна одновременно держать в памяти весь большой проект: исходный код, тесты, историю изменений и переписку — без необходимости разбивать работу на части.
Z.ai расширила обучение модели на сценариях с длинным контекстом — масштабной разработке, автоматизированных исследованиях, оптимизации производительности и сложной отладке.
Как работает архитектура
GLM-5.2 построена на архитектуре Mixture-of-Experts с 753 миллиардами параметров. Для поддержки контекста в один миллион токенов Z.ai разработала собственный механизм IndexShare.
Как это работает: обычно каждый слой модели тратит вычислительные ресурсы на поиск нужных фрагментов в длинном контексте. В GLM-5.2 каждые четыре слоя используют один общий индексатор вместо четырех отдельных. Это снижает вычислительную нагрузку почти в три раза при работе с контекстом в один миллион токенов.
Дополнительно модель поддерживает два режима работы:
— High — баланс скорости и качества для стандартных задач
— Max — максимальная производительность для особо сложных случаев.
Результаты в тестах
Есть несколько стандартных тестов для сравнения ИИ-моделей в разработке.
SWE-bench Pro — решение реальных багов из GitHub. GLM-5.2 набрала 62,1 балла, GPT-5.5 — 58,6, Claude Opus 4.8 — 69,2.
Terminal-Bench 2.1 — работа в терминале с реальными инструментами. GLM-5.2 — 81,0, GPT-5.5 — 84,0, Claude Opus 4.8 — 85,0.
FrontierSWE — самостоятельное ведение технического проекта на протяжении часов. GLM-5.2 — 74,4, GPT-5.5 — 72,6, Claude Opus 4.8 — 75,1.
PostTrainBench — модель получает GPU и должна самостоятельно улучшить другую модель через дообучение. GLM-5.2 — 34,3, GPT-5.5 — 28,4, Claude Opus 4.8 — 37,2.
Среди моделей с открытым кодом GLM-5.2 показала лучший результат по всем долгосрочным тестам.
Лицензия MIT — что это дает
Модель распространяется под лицензией MIT. Это означает: без региональных ограничений, без роялти, можно использовать, изменять и встраивать в коммерческие продукты без согласований с Z.ai.
Для компаний это важно: модель можно развернуть на собственных серверах, не завися от внешнего провайдера.
Веса опубликованы на Hugging Face, модель доступна через API Z.ai и более 20 платформ для разработки, включая Claude Code, OpenCode и ZCode.
Как начать использовать
Для подписчиков GLM Coding Plan модель уже доступна. Ее можно запустить в привычных инструментах — ZCode, Claude Code, OpenCode и других. В Claude Code модель подключается под именем GLM-5.2 с поддержкой контекста в один миллион токенов.
По тарификации: до конца сентября 2026 года использование в непиковые часы списывает квоту в стандартном размере. В пиковые часы — с 14:00 до 18:00 по пекинскому времени — расход квоты увеличивается в три раза.
Подписка оформляется на сайте z.ai/subscribe.
