Компанія Meta представила перші дві моделі з нового мультимодального сімейства Llama 4: Llama 4 Scout та Llama 4 Maverick. Згідно з планами Meta, сімейство Llama 4 складатиметься з чотирьох моделей, з яких дві вже запущені, а решта з’являться в найближчому майбутньому. Усі моделі навчалися на великій кількості неанотованого тексту, зображень та відео, що дозволяє їм досягти розширених можливостей візуального сприйняття.
Про це розповідає ProIT
Швидкий запуск нових моделей обумовлений успішним просуванням відкритих моделей китайської лабораторії DeepSeek, які демонструють результати, що зрівнюються або навіть перевищують показники попередніх моделей Meta. Як повідомляється, Meta створила «воєнні кімнати», щоб вивчити, як DeepSeek вдалося знизити витрати на запуск і використання моделей типу R1 і V3.
«Llama 4 Maverick — це робоча конячка, яка найкраще справляється з розумінням зображень і тексту для типових завдань асистента та спілкування в чаті», — зазначила компанія.
На відміну від Maverick, модель Llama 4 Scout спеціалізується на таких завданнях, як узагальнення документів, аналіз дій користувачів для персоналізації завдань та логічне опрацювання складних кодових баз.
Майбутні моделі та їх характеристики
Meta також анонсувала Llama 4 Behemoth, майбутню модель, яку компанія називає «однією з найрозумніших ШІ-моделей у світі». Генеральний директор Марк Цукерберг підтвердив, що четверта модель, Llama 4 Reasoning, буде представлена у найближчий місяць.
Llama 4 Maverick і Scout вже доступні для завантаження на сайті Llama та Hugging Face і вже інтегровані у Meta AI, зокрема у WhatsApp, Messenger та Instagram.
Llama 4 Scout має 17 мільярдів активних параметрів і 16 експертів. За словами Цукерберга, ця модель є «надзвичайно швидкою» та нативно мультимодальною, з контекстом обсягом до 10 мільйонів токенів, спроектованою для роботи на одному графічному процесорі.
Llama 4 Maverick також має 17 мільярдів активних параметрів, але вже 128 експертів. Meta стверджує, що ця модель перевершує GPT-4o та Gemini 2.0 у завданнях з кодування, логіки, багатомовності, роботи з довгим контекстом і зображеннями, а також конкурує з DeepSeek v3.1 за якістю логічних міркувань і кодування.
Огляд майбутніх анонсів
Модель Llama 4 Behemoth ще перебуває на стадії навчання, але Meta вже стверджує, що це буде «найпотужніша базова модель у світі», з 288 мільярдами активних параметрів. Незабаром варто очікувати більше деталей не лише про Behemoth, але й про модель Llama 4 Reasoning, оскільки вже за кілька тижнів запланована велика конференція Meta для розробників ШІ — LlamaCon.
Нагадаємо, що в січні 2025 року, під час судового процесу, стало відомо про те, що Meta незаконно використала мільйони книг для навчання своїх моделей ШІ.