Meta анонсировала линейку Llama 4 с мультимодальными возможностями

Meta анонсировала четвертую версию семейства Llama — линейку продвинутых моделей искусственного интеллекта. В нее вошли Llama 4 Scout, Llama 4 Maverick и Llama 4 Behemoth. Все модели обучены на масштабных массивах неразмеченных текстов, изображений и видео, что обеспечивает им широкий визуальный и контекстный охват.

Разработка Llama 4 была ускорена на фоне успеха китайской DeepSeek, чьи модели R1 и V3 превзошли предыдущие версии Llama по ряду метрик. В ответ Meta сформировала специальные команды для изучения подходов конкурентов к снижению затрат на обучение и масштабирование.

Модели Scout и Maverick уже доступны для загрузки на сайте Llama.com и через партнеров Meta, включая Hugging Face. Behemoth пока остается на стадии обучения. В то же время обновленный Meta AI с Llama 4 уже запущен в 40 странах.

По результатам внутренних тестов Meta, Maverick опережает GPT-4o и Gemini 2.0 в задачах программирования, мультиязычного ввода и анализа изображений, но уступает более свежим моделям, таким как Gemini 2.5 Pro и Claude 3.7 Sonnet.

Scout выделяется возможностями по анализу больших кодовых баз и суммированию документов. Его контекстное окно достигает 10 миллионов токенов, что позволяет обрабатывать массивные визуальные и текстовые данные. При этом модель может работать на одной видеокарте Nvidia H100, в отличие от Maverick, требующего более мощную систему DGX.

Behemoth — самая мощная модель в линейке с почти 2 триллионами параметров, из которых 288 миллиардов активны. Она уже демонстрирует превосходство над GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Pro в задачах, связанных с точными науками, но пока уступает Gemini 2.5 Pro.

Также Meta пересмотрела поведение моделей Llama 4 по «чувствительным» темам: теперь они реже отказываются от ответов, предоставляя взвешенные мнения по политическим и социальным вопросам с сохранением нейтралитета.В компании заявляют, что Llama 4 — лишь первый шаг в новом этапе развития открытых моделей Meta.

Источник: TechCrunch