Головна Технології Google DeepMind представила SIMA 2: агент нового покоління з підтримкою Gemini

Google DeepMind представила SIMA 2: агент нового покоління з підтримкою Gemini

Google DeepMind презентувала попередню версію SIMA 2 — удосконаленого універсального штучного агента, який поєднує мовні та логічні можливості великої мовної моделі Gemini. На відміну від попередньої версії, SIMA 2 не просто виконує інструкції, а здатна розуміти та взаємодіяти зі своїм віртуальним середовищем, демонструючи значно глибший рівень інтелектуальної гнучкості.

Про це розповідає ProIT

Новий рівень універсальності та самонавчання

Перша версія SIMA тренувалася на сотнях годин ігрових даних і могла виконувати базові завдання у різних 3D-іграх, навіть тих, для яких не була спеціально навчена. Проте успішність виконання складних завдань складала лише 31% порівняно з 71% у людей. SIMA 2, за словами старшого наукового співробітника DeepMind Джо Маріно, робить суттєвий крок уперед: агент здатен вирішувати комплексні задачі в нових для нього середовищах, а також удосконалювати власні вміння на основі досвіду.

“SIMA 2 is a step change and improvement in capabilities over SIMA 1. It’s a more general agent. It can complete complex tasks in previously unseen environments. And it’s a self-improving agent. So it can actually self-improve based on its own experience, which is a step towards more general-purpose robots and AGI systems more generally” – зазначив Джо Маріно, старший науковий співробітник DeepMind.

Технологічна база та інноваційні можливості

Основою SIMA 2 є модель Gemini 2.5 flash-lite, яка забезпечує агенту широку гнучкість для вирішення інтелектуальних завдань, а також можливість навчатися та узагальнювати знання в різних сферах. На відміну від агентів, які працюють лише з цифровими даними, SIMA 2 є втіленим агентом: він сприймає світ через «тіло» — взаємодіє із середовищем та об’єктами подібно до людини чи робота.

Дослідниця DeepMind Джейн Ван підкреслила, що SIMA 2 значно перевершує рівень звичайної ігрової взаємодії, адже агенту «потрібно розуміти, що відбувається, розпізнавати запити користувача та реагувати на них логічно й з урахуванням здорового глузду».

Завдяки впровадженню Gemini, SIMA 2 удвічі перевершила попередника за результативністю, поєднуючи мовні й логічні можливості з навичками, отриманими під час навчання у віртуальних світах. Під час демонстрації у грі No Man’s Sky агент описував навколишній ландшафт та визначав наступні дії, реагуючи на сигнали тривоги. У іншому прикладі SIMA 2 розпізнала будинок за підказкою про «колір стиглого томату» й логічно дійшла до червоного будинку.

Інтеграція Gemini також дозволила SIMA 2 сприймати інструкції у вигляді емодзі — наприклад, після команди з малюнками сокири й дерева агент самостійно знаходить дерево та зрубує його.

Ще однією новацією стала здатність SIMA 2 орієнтуватися у фотореалістичних світах, створених моделлю Genie від DeepMind, де агент розпізнає й взаємодіє з об’єктами, такими як лавки, дерева чи метелики.

Важливим кроком стало й те, що для самонавчання SIMA 2 не потребує великої кількості людських даних. Якщо перша версія базувалася виключно на зразках геймплею людей, то SIMA 2 використовує ці навички як стартову платформу. Потрапляючи у нове середовище, агент отримує завдання від іншої моделі Gemini, а окрема система оцінює спроби виконання завдань. Завдяки цьому агент навчається на власних помилках і поступово вдосконалює поведінку, отримуючи зворотний зв’язок не від людей, а від моделі штучного інтелекту.

DeepMind розглядає SIMA 2 як крок до створення універсальних роботів, здатних виконувати широкий спектр завдань у реальному світі. Фредерік Бесс, старший інженер DeepMind, пояснив, що такі системи мають поєднувати високорівневе розуміння та логіку з можливістю планувати й досягати складних цілей. Проте наразі команда не озвучує конкретних термінів впровадження SIMA 2 у фізичну робототехніку.

Попри те, що наразі доступна лише попередня версія SIMA 2, команда DeepMind відкрита до співпраці й очікує на нові можливості використання цієї технології у різних сферах.

SIMA 2 DeepMind

Читайте також

About Us

Soledad is the Best Newspaper and Magazine WordPress Theme with tons of options and demos ready to import. This theme is perfect for blogs and excellent for online stores, news, magazine or review sites. Buy Soledad now!

Latest Articles

© ProIT. Видання не несе жодної відповідальності за зміст і достовірність фактів, думок, поглядів, аргументів та висновків, які викладені у інформаційних матеріалах з посиланням на інші джерела інформації. Усі запити щодо такої інформації мають надсилатися виключно джерелам відповідної інформації.