Google запускает Gemini Deep Think — самый мощный ИИ-модель для логических рассуждений

Google DeepMind представила Gemini 2.5 Deep Think — свою самую продвинутую модель искусственного интеллекта для логических задач. Она способна одновременно рассматривать и анализировать несколько вариантов ответа, а затем выбирать наилучший из них.

Gemini 2.5 Deep Think станет доступна подписчикам тарифа Ultra стоимостью $250 в месяц через приложение Gemini.

Deep Think может быть особенно полезна при решении задач, связанных с креативностью, стратегическим планированием и пошаговым улучшением процессов.

Модель показывает выдающиеся результаты на тесте Humanity’s Last Exam, который проверяет способности ИИ отвечать на тысячи сложных вопросов по математике, гуманитарным и естественным наукам. Gemini 2.5 Deep Think набрала 34,8%, тогда как Grok 4 от xAI получил 25,4%, а o3 от OpenAI — 20,3%.

На тесте LiveCodeBench 6, включающем сложные задачи по программированию, модель от Google также обошла конкурентов, показав результат 87,6 процента. Grok 4 получил 79%, а o3 — 72%.

Модель умеет автоматически использовать инструменты вроде Google Search и исполнения кода, а также генерирует более длинные и содержательные ответы по сравнению с традиционными ИИ-моделями.

В экспериментах Google Deep Think показала лучшие результаты в задачах по веб-разработке и созданию визуального контента. Компания рассчитывает, что модель поможет ускорить научные открытия.

В ближайшие недели Google планирует предоставить доступ к Gemini 2.5 Deep Think через API ограниченному числу разработчиков и корпоративных клиентов, чтобы изучить сценарии применения системы в бизнесе и науке.

Источник: TechCrunch