Google Veo 3 — новітня модель генерації відео на базі штучного інтелекту, яку розробляє DeepMind, підрозділ Google, може стати фундаментом для створення ігрових світових моделей. Такі моделі дозволяють не лише генерувати реалістичне відео, а й симулювати взаємодію користувача з віртуальним середовищем.
Про це розповідає ProIT
Потенціал Veo 3 для ігрової індустрії
Генеральний директор DeepMind Деміс Хассабіс натякнув на можливість застосування Veo 3 у відеоіграх, відповідаючи на запитання користувачів у соціальних мережах. На пост із закликом дозволити гравцям «грати у відеогру зі своїх відео Veo 3» і питанням «коли будуть ігрові світові моделі?», Хассабіс відповів:
“now wouldn’t that be something”.
Логан Кілпатрік, керівник продукту Google AI Studio та Gemini API, також загадково прокоментував цю тему, що ще більше підігріло інтерес спільноти.
Від генерації відео до інтерактивних світів
Між тим, представники компанії підкреслюють, що наразі Veo 3 ще не є повноцінною світовою моделлю. Світові моделі імітують динаміку реального середовища, дозволяючи агентам прогнозувати розвиток ситуацій у відповідь на їхні дії, тоді як генеративні відеомоделі, такі як Veo 3, створюють реалістичні відеопослідовності.
Однак Google вже працює над тим, щоб перетворити свою мультимодальну модель Gemini 2.5 Pro на світову модель, здатну імітувати функції людського мозку. У грудні DeepMind представила модель Genie 2, яка може створювати безліч ігрових світів. Також у січні стало відомо, що Google формує нову команду для розробки AI-моделей, здатних імітувати реальність.
Veo 3 наразі перебуває у стадії відкритого тестування і може створювати не лише відео, а й аудіо, включаючи мовлення й саундтреки. Технологія дозволяє симулювати реалістичну фізику рухів, проте поки що Veo 3 залишається пасивною генеративною моделлю. Для того, щоб вона стала справжнім симулятором ігрових світів, необхідно забезпечити інтерактивність, активність і передбачуваність поведінки.
Головна складність у створенні відеоігор — це не лише реалістика зображення, а й можливість керувати подіями в режимі реального часу. Тому перспективним виглядає гібридний підхід, де могли б об’єднатися можливості Veo та Genie для розробки ігрових чи симульованих світів.
У сфері світових моделей вже активно працюють інші компанії. Зокрема, піонерка AI Фей-Фей Лі презентувала стартап World Labs, який створює тривимірні сцени на основі одного зображення. Крім того, Google може зіштовхнутися з конкуренцією з боку Microsoft, Scenario, Runway, Pika, а також майбутньої відеогенеративної моделі Sora від OpenAI.
З огляду на амбіції Google у сфері світових моделей, а також її ресурси та вплив, конкурентам варто уважно стежити за подальшими кроками компанії у цьому напрямку.