Google Veo 3 — новейшая модель генерации видео на основе искусственного интеллекта, разрабатываемая DeepMind, подразделением Google, может стать основой для создания игровых миров. Такие модели позволяют не только генерировать реалистичное видео, но и симулировать взаимодействие пользователя с виртуальной средой.
Об этом сообщает ProIT
Потенциал Veo 3 для игровой индустрии
Генеральный директор DeepMind Демис Хассабис намекнул на возможность применения Veo 3 в видеоиграх, отвечая на вопросы пользователей в социальных сетях. На пост с призывом позволить игрокам «играть в видеоигры на основе своих видео Veo 3» и вопросом «когда будут игровые мировые модели?», Хассабис ответил:
«разве это не было бы чем-то удивительным».
Логан Килпатрик, руководитель продукта Google AI Studio и Gemini API, также загадочно прокомментировал эту тему, что еще больше подогрело интерес сообщества.
От генерации видео к интерактивным мирам
Между тем, представители компании подчеркивают, что на данный момент Veo 3 еще не является полноценной мировой моделью. Мировые модели имитируют динамику реальной среды, позволяя агентам прогнозировать развитие ситуаций в ответ на их действия, тогда как генеративные видеомодели, такие как Veo 3, создают реалистичные видеопоследовательности.
Однако Google уже работает над тем, чтобы преобразовать свою мультимодальную модель Gemini 2.5 Pro в мировую модель, способную имитировать функции человеческого мозга. В декабре DeepMind представила модель Genie 2, которая может создавать множество игровых миров. Также в январе стало известно, что Google формирует новую команду для разработки AI-моделей, способных имитировать реальность.
Veo 3 в настоящее время находится на стадии открытого тестирования и может создавать не только видео, но и аудио, включая речь и саундтреки. Технология позволяет симулировать реалистичную физику движений, однако пока что Veo 3 остается пассивной генеративной моделью. Для того чтобы она стала настоящим симулятором игровых миров, необходимо обеспечить интерактивность, активность и предсказуемость поведения.
Главная сложность в создании видеоигр — это не только реалистичность изображения, но и возможность управлять событиями в реальном времени. Поэтому перспективным выглядит гибридный подход, где могли бы объединиться возможности Veo и Genie для разработки игровых или симулированных миров.
В сфере мировых моделей уже активно работают другие компании. В частности, пионер AI Фей-Фей Ли презентовала стартап World Labs, который создает трехмерные сцены на основе одного изображения. Кроме того, Google может столкнуться с конкуренцией со стороны Microsoft, Scenario, Runway, Pika, а также будущей видеогенеративной модели Sora от OpenAI.
Учитывая амбиции Google в сфере мировых моделей, а также ее ресурсы и влияние, конкурентам стоит внимательно следить за дальнейшими шагами компании в этом направлении.