Meta презентує V-JEPA 2: нова AI-модель для розуміння світу

Meta анонсувала випуск нової штучного інтелекту V-JEPA 2, яку компанія позиціонує як «світову модель» для поглибленого розуміння навколишнього середовища AI-агентами.

Про це розповідає ProIT

Покращення в порівнянні з попередньою версією

V-JEPA 2 є розвитком моделі V-JEPA, яку Meta презентувала минулого року. Перша версія була навчена на понад одному мільйоні годин відеоматеріалів, що має допомогти роботам і іншим AI-системам краще орієнтуватися у фізичному світі, передбачаючи наслідки взаємодії, наприклад, вплив гравітації на подальший розвиток подій у послідовності дій.

Завдяки такому підходу, моделі надають штучному інтелекту базові зв’язки, які діти й тварини засвоюють інтуїтивно під час розвитку. Наприклад, коли собака грає у підбирання м’яча, він розуміє, що після відскоку м’яч підніметься вгору, і біжить туди, де м’яч приземлиться, а не до його поточного місця розташування.

Реальні приклади застосування та переваги моделі

Meta наводить приклади, коли робот отримує завдання, наприклад, тримаючи тарілку та лопатку й прямуючи до плити з приготованими яйцями. В такій ситуації AI здатний спрогнозувати, що наступною логічною дією буде перекласти яйця з плити на тарілку за допомогою лопатки.

За словами компанії, V-JEPA 2 працює у 30 разів швидше, ніж модель Cosmos від Nvidia, яка також розробляється для розуміння фізичного світу. Водночас Meta може використовувати власні критерії оцінки ефективності моделей, що може відрізнятися від підходу Nvidia.

“We believe world models will usher a new era for robotics, enabling real-world AI agents to help with chores and physical tasks without needing astronomical amounts of robotic training data,” explained Meta’s chief AI scientist Yann LeCun in a video.