Google представила Gemini Robotics On-Device: автономная ИИ-модель для роботов

|
Google представила Gemini Robotics On-Device: автономная ИИ-модель для роботов

Команда Google DeepMind анонсировала новую модель искусственного интеллекта Gemini Robotics On-Device, ориентированную на робототехнику. Особенность этой VLA-модели заключается в способности работать полностью автономно, без подключения к интернету или использования облачных сервисов, что делает её востребованной для промышленных и бытовых роботов с ограниченными вычислительными ресурсами.

Об этом сообщает ProIT

Особенности модели Gemini Robotics On-Device

Gemini Robotics On-Device построена на основе предыдущей версии Gemini Robotics, которая была представлена в марте. Новая модель разработана специально для «двуруких» роботов, с учетом их аппаратных ограничений. Она способна распознавать и интерпретировать команды, сформулированные на естественном языке, и выполнять точные и сложные операции — например, расстёгивать молнию на сумке или аккуратно складывать одежду. Все процессы происходят непосредственно на устройстве, без необходимости во внешнем соединении с интернетом.

В блоге говорится, что новая модель понимает инструкции на естественном языке, выполняет очень точные и сложные задачи (например, расстёгивает молнию на сумке или складывает одежду). И всё это — непосредственно на самом роботе, без интернета или облачной обработки.

Результаты тестирования и возможности интеграции

В ходе тестовых испытаний Gemini Robotics On-Device показала производительность, почти идентичную облачной версии Gemini Robotics, и даже превзошла другие локальные модели в общих бенчмарках. Однако компания не раскрыла точных критериев сравнения. Во время демонстрации Google продемонстрировала, как роботы на базе этой автономной модели выполняют задачи, такие как расстёгивание сумок и складывание одежды.

Сначала новую ИИ-модель разрабатывали для роботов серии ALOHA, но затем адаптировали для работы на двуруком Franka FR3, а также на гуманоиде Apollo, созданном компанией Apptronik. По словам исследователей, робот Franka FR3 успешно справлялся с новыми, ранее неизвестными для модели задачами — например, сбором деталей на производственном конвейере.

Кроме того, Google DeepMind выпустила специальный инструмент Gemini Robotics SDK для разработчиков. Он позволяет обучать роботов выполнению новых задач на основе всего лишь 50–100 демонстраций, что значительно упрощает и ускоряет адаптацию роботов к новым условиям труда.