Компания Meta представила первые две модели из нового мультимодального семейства Llama 4: Llama 4 Scout и Llama 4 Maverick. Согласно планам Meta, семейство Llama 4 будет состоять из четырех моделей, две из которых уже запущены, а остальные появятся в ближайшем будущем. Все модели обучались на большом количестве неаннотированного текста, изображений и видео, что позволяет им достигать расширенных возможностей визуального восприятия.
Об этом сообщает ProIT
Быстрый запуск новых моделей обусловлен успешным продвижением открытых моделей китайской лаборатории DeepSeek, которые демонстрируют результаты, сопоставимые или даже превышающие показатели предыдущих моделей Meta. Как сообщается, Meta создала «военные комнаты», чтобы изучить, как DeepSeek удалось снизить затраты на запуск и использование моделей типа R1 и V3.
«Llama 4 Maverick — это рабочая лошадка, которая лучше всего справляется с пониманием изображений и текста для типовых задач ассистента и общения в чате», — отметила компания.
В отличие от Maverick, модель Llama 4 Scout специализируется на таких задачах, как обобщение документов, анализ действий пользователей для персонализации задач и логическая обработка сложных кодовых баз.
Будущие модели и их характеристики
Meta также анонсировала Llama 4 Behemoth, будущую модель, которую компания называет «одной из самых умных ИИ-моделей в мире». Генеральный директор Марк Цукерберг подтвердил, что четвертая модель, Llama 4 Reasoning, будет представлена в ближайший месяц.
Llama 4 Maverick и Scout уже доступны для загрузки на сайте Llama и Hugging Face и уже интегрированы в Meta AI, в частности, в WhatsApp, Messenger и Instagram.
Llama 4 Scout имеет 17 миллиардов активных параметров и 16 экспертов. По словам Цукерберга, эта модель является «исключительно быстрой» и нативно мультимодальной, с контекстом объемом до 10 миллионов токенов, спроектированной для работы на одном графическом процессоре.
Llama 4 Maverick также имеет 17 миллиардов активных параметров, но уже 128 экспертов. Meta утверждает, что эта модель превосходит GPT-4o и Gemini 2.0 в задачах кодирования, логики, многозначности, работы с длинным контекстом и изображениями, а также конкурирует с DeepSeek v3.1 по качеству логических рассуждений и кодирования.
Обзор будущих анонсов
Модель Llama 4 Behemoth еще находится на стадии обучения, но Meta уже утверждает, что это будет «самая мощная базовая модель в мире», с 288 миллиардами активных параметров. Вскоре стоит ожидать больше деталей не только о Behemoth, но и о модели Llama 4 Reasoning, так как уже через несколько недель запланирована большая конференция Meta для разработчиков ИИ — LlamaCon.
Напомним, что в январе 2025 года, во время судебного процесса, стало известно о том, что Meta незаконно использовала миллионы книг для обучения своих моделей ИИ.