Meta анонсирует новую AI-модель V-JEPA 2 для понимания мира

Meta анонсировала выпуск новой модели искусственного интеллекта V-JEPA 2, которую компания позиционирует как «мировую модель» для углубленного понимания окружающей среды AI-агентами.

Об этом сообщает ProIT

Улучшения по сравнению с предыдущей версией

V-JEPA 2 является развитием модели V-JEPA, которую Meta представила в прошлом году. Первая версия была обучена на более чем одном миллионе часов видеоматериалов, что должно помочь роботам и другим AI-системам лучше ориентироваться в физическом мире, предсказывая последствия взаимодействия, например, влияние гравитации на дальнейшее развитие событий в последовательности действий.

Благодаря такому подходу модели предоставляют искусственному интеллекту базовые связи, которые дети и животные усваивают интуитивно в процессе развития. Например, когда собака играет в подбрасывание мяча, она понимает, что после отскока мяч поднимется вверх, и бежит туда, где мяч приземлится, а не к его текущему местоположению.

Реальные примеры применения и преимущества модели

Meta приводит примеры, когда робот получает задание, например, держа тарелку и лопатку и направляясь к плите с приготовленными яйцами. В такой ситуации AI способен предсказать, что следующей логической действием будет переложить яйца с плиты на тарелку с помощью лопатки.

По словам компании, V-JEPA 2 работает в 30 раз быстрее, чем модель Cosmos от Nvidia, которая также разрабатывается для понимания физического мира. В то же время Meta может использовать собственные критерии оценки эффективности моделей, которые могут отличаться от подхода Nvidia.

“Мы верим, что мировые модели откроют новую эру для робототехники, позволяя реальным AI-агентам помогать с домашними делами и физическими задачами без необходимости в астрономических объемах обучающих данных для роботов,” объяснил главный ученый AI Meta Ян ЛеКун в видео.