Runway представила первую мировую модель GWM-1 и обновила видеомодель Gen 4.5 с аудио

|
Runway представила первую мировую модель GWM-1 и обновила видеомодель Gen 4.5 с аудио

Компания Runway, специализирующаяся на генерации изображений и видео с помощью искусственного интеллекта, анонсировала выпуск своей первой мировой модели — GWM-1. Эта разработка позволяет создавать симуляции на основе покадрового прогнозирования, что обеспечивает модели понимание физики и закономерностей развития событий в реальном мире.

Об этом сообщает ProIT

Возможности и направления применения GWM-1

Мировая модель — это система искусственного интеллекта, которая формирует внутреннюю симуляцию окружающего мира, что дает возможность самостоятельно анализировать, планировать и действовать без необходимости тренировки на всех возможных сценариях реальной жизни. Runway подчеркивает, что GWM-1 является более универсальной по сравнению с конкурентами, в частности Genie-3 от Google, и может применяться для обучения агентов в таких сферах, как робототехника и науки о жизни.

Компания также представила несколько специализированных направлений для новой модели: GWM-Worlds, GWM-Robotics и GWM-Avatars. Приложение GWM-Worlds позволяет пользователям создавать интерактивные проекты, где модель генерирует среду с учетом геометрии, физики и освещения. Это решение станет полезным не только для гейминга, но и для обучения агентов ориентированию и поведению в физическом мире.

GWM-Robotics и GWM-Avatars: инновации для робототехники и аватаров

GWM-Robotics использует синтетические данные с дополнительными параметрами, такими как изменение погодных условий или неожиданные препятствия. Как отмечает Runway, этот подход позволяет выявлять, когда и при каких условиях роботы могут нарушать политики или инструкции в различных ситуациях. Компания планирует предоставить доступ к GWM-Robotics через SDK, а также ведет переговоры с рядом робототехнических компаний и предприятий по поводу использования GWM-Robotics и GWM-Avatars.

Еще одним направлением является GWM-Avatars, который предполагает создание реалистичных аватаров с симуляцией человеческого поведения. Подобные технологии уже разрабатывают такие компании, как D-ID, Synthesia, Soul Machines и Google, применяя их в сферах общения и обучения.

«GWM-Worlds — это приложение, которое позволяет создавать интерактивный проект. Пользователи задают сцену через подсказку, и модель генерирует мир с пониманием геометрии, физики и освещения.»

Помимо запуска мировой модели, Runway модернизировала свою базовую видеомодель Gen 4.5, которая уже возглавила рейтинг Video Arena, обогнав разработки Google и OpenAI. Обновление включает функцию нативного аудио и возможность создания более длинных видео с множеством сцен. Благодаря этим изменениям пользователи получают возможность генерировать видео продолжительностью до одной минуты с целостными персонажами, диалогами, фоновым звуком и сложными ракурсами.

Обновленная Gen 4.5 приближает Runway к уровню конкурента Kling, который недавно представил собственный комплексный видеосервис с поддержкой аудио и многослойной нарративной структуры. Такие улучшения свидетельствуют о переходе генеративных видеомоделей от этапа прототипов к готовым для широкого использования инструментам.

Обновленная Gen 4.5 сначала станет доступной для корпоративных клиентов, а затем — для всех пользователей с платными подписками.

Runway GWM-1 и Gen 4.5