Google представила Gemini 2.5 — ИИ, который превосходит модели от OpenAI

Компания Google представила Gemini 2.5 — новое семейство моделей искусственного интеллекта, которые «размышляют» перед тем, как ответить на вопрос.

Чтобы представить новое семейство моделей, Google запускает Gemini 2.5 Pro Experimental — мультимодальную модель искусственного интеллекта, которая, по заявлению компании, самая интеллектуальной из всех ее моделей. Эта модель будет доступна во вторник на платформе разработчиков Google AI Studio, а также в приложении Gemini для подписчиков тарифного плана Gemini Advanced стоимостью $20 в месяц.

Методы логического мышления помогли моделям ИИ достичь новых высот в решении математических задач и задач по программированию. Многие в мире технологий считают, что модели логического мышления станут ключевым компонентом ИИ-агентов — автономных систем, которые могут выполнять задачи практически без участия человека.

Gemini 2.5 Pro превосходит предыдущие передовые модели ИИ и некоторые из ведущих конкурирующих моделей ИИ по нескольким показателям. В частности, Google заявляет, что Gemini 2.5 предназначен для создания визуально привлекательных веб-приложений и приложений с агентским кодированием.

По результатам оценки редактирования кода с помощью Aider Polyglot, Gemini 2.5 Pro набирает 68,6%, превосходя лучшие модели ИИ от OpenAI, Anthropic и китайской лаборатории DeepSeek.

В другом тесте, измеряющем способности разработчиков программного обеспечения, SWE-bench Verified, Gemini 2.5 Pro набирает 63,8%, опережая o3-mini от OpenAI и R1 от DeepSeek, но уступая Claude 3.7 Sonnet от Anthropic, который набрал 70,3%.

В Humanity’s Last Exam — мультимодальном тесте, состоящем из тысяч вопросов, составленных с помощью краудсорсинга и связанных с математикой, гуманитарными и естественными науками, — Gemini 2.5 Pro набрал 18,8%, показав результат лучше, чем у большинства флагманских моделей конкурентов.

Gemini 2.5 Pro поставляется с контекстным окном в 1 миллион токенов, что означает, что модель ИИ может обрабатывать примерно 750 000 слов за один раз. Это больше, чем вся серия книг «Властелин колец».

Источник: TechCrunch