Стартап General Intuition, що виник на базі платформи Medal для завантаження та обміну відеокліпами з відеоігор, оголосив про залучення $133,7 мільйона інвестицій на ранньому етапі. Мета компанії — створення фундаментальних моделей штучного інтелекту, які навчаються просторово-часовому мисленню за допомогою величезної бібліотеки ігрового відео.
Про це розповідає ProIT
Унікальний підхід до навчання агентів
За словами засновника Medal і General Intuition Піма де Вітте, ігрові відео дозволяють агентам отримувати досвід взаємодії з різноманітними середовищами так, як це роблять люди під час гри. Величезний масив даних Medal — понад 2 мільярди відео щорічно від 10 мільйонів активних користувачів у десятках тисяч ігор — дає змогу створювати унікальні вибірки, які ідеально підходять для тренування штучного інтелекту.
“When you play video games, you essentially transfer your perception, usually through a first-person view of the camera, to different environments,” Pim de Witte, CEO of Medal and General Intuition, told TechCrunch. He noted that gamers who upload clips tend to post very negative or positive examples, which serve as really useful edge cases for training. “You get this selection bias towards precisely the kind of data you actually want to use for training work.”
Саме унікальний набір даних Medal привернув увагу таких гігантів індустрії штучного інтелекту, як OpenAI, яка намагалася придбати Medal наприкінці минулого року за $500 мільйонів. Після цієї спроби компанія General Intuition змогла залучити інвестиції від Khosla Ventures, General Catalyst та Raine.
Від відеоігор — до робототехніки та рятувальних дронів
Отримані кошти General Intuition планує спрямувати на розширення команди інженерів і дослідників, щоб навчати універсальних агентів взаємодіяти з реальним світом. Перший етап застосування технології — ігрова індустрія, а також дрони для пошуково-рятувальних операцій.
Моделі General Intuition вже здатні розуміти нові середовища, на яких вони не тренувалися, і точно передбачати дії у цих середовищах. Вхідні дані — лише зображення з екрану, які бачить гравець, а навігація виконується за допомогою контролера. Це дозволяє масштабувати рішення на фізичні пристрої — роботизовані маніпулятори, дрони та автономні транспортні засоби, що часто керуються аналогічно до ігрових персонажів.
У найближчих планах компанії — створення симульованих світів для тренування інших агентів і розробка алгоритмів автономної навігації у нових фізичних просторах. Такий підхід відрізняє General Intuition від конкурентів, які продають готові моделі симуляції світів, зосереджуючись на контенті для розробників ігор.
General Intuition, натомість, не прагне конкурувати з ігровими студіями. Основна увага — створення інтелектуальних ботів та неігрових персонажів, які можуть навчатися та адаптуватися до будь-якого рівня складності. Як пояснює співзасновник Moritz Baier-Lentz, ідея не у створенні «непереможних» ботів, а у підтримці балансу та залученості гравців завдяки поступовому масштабуванню складності, що тримає інтерес користувачів на високому рівні.
Досвід Піма де Вітте у гуманітарній сфері вплинув на розвиток технологій для автономних рятувальних дронів, які мають працювати у незнайомих місцевостях без GPS та здійснювати збір критичної інформації.
Засновники General Intuition підкреслюють, що ключова функція моделі — просторово-часове мислення — є обов’язковим компонентом на шляху до штучного загального інтелекту (AGI). Компанія переконана, що сучасні мовні моделі, незважаючи на свою потужність, не в змозі забезпечити цей рівень абстракції та розуміння.
Пім де Вітте наголошує: ми описуємо світ мовою, але при цьому втрачаємо чимало інформації, зокрема здатність до просторово-часового мислення, яку прагне відтворити General Intuition.