Стартап Human Archive зі США активно використовує зростання gig-економіки Індії, збираючи унікальні відео- та сенсорні дані для навчання робототехніки. Компанія співпрацює з низкою сервісних платформ, щоб обладнати працівників спеціальними головними уборами з камерами. Це дозволяє фіксувати процеси повсякденної роботи з першої особи, що створює цінний матеріал для розвитку штучного інтелекту та роботів.
Про це розповідає ProIT
Збір даних через співпрацю з gig-платформами
Human Archive вже залучила понад 1 000 активних гарнітур, які працюють у сферах домашніх послуг, готелів та ресторанного бізнесу. Нещодавно компанія отримала новий раунд фінансування в розмірі $8,2 млн від Wing Venture Capital, NVP Capital, Y Combinator та інвесторів з OpenAI, Nvidia, Google, Mercor, AfterQuery, BAIR, SAIL, Brad Boa і Meta. Засновники Human Archive — Самей Мані, Рушіл Агарвал, Шлок Пател і Радж Пател (генеральний директор) — вихідці з університетів Берклі та Стенфорд, мають досвід у галузях робототехніки та обробки тактильних даних.
Компанія обґрунтовує свою діяльність тим, що сучасній індустрії AI бракує реальних якісних даних для навчання машин виконанню фізичних завдань. Human Archive вважає, що працівники gig-економіки Індії — це невикористаний, але масштабований ресурс для такого збору даних.
Інноваційні пристрої та розширення географії
Попри відмову від співпраці з великими гравцями ринку, такими як Pronto та Urban Company, Human Archive продовжила роботу з меншими стартапами, пропонуючи клієнтам вибір: знижка на послуги у разі згоди на відеофіксацію або повна оплата без запису. Користувачі часто обирають перший варіант, адже відео допомагає вирішувати спірні питання щодо якості сервісу.
Human Archive виплачує працівникам $1 за годину участі у зборі даних, при тому як конкуренти можуть пропонувати $2,6–$4,2. Завдяки локальному присутності в Індії, компанія має змогу знижувати витрати на оплату праці.
Для збору максимально цінної інформації, стартап розробляє та використовує не лише головні гарнітури, але й тактильні рукавички, костюми для захоплення руху та камери на зап’ястях. Синхронізуючи відео з сенсорними даними, Human Archive створює багаті датасети для AI-лабораторій. Уже понад 50 різних пристроїв використовуються для збору різноманітних даних.
“Жодна інша компанія у світі не змогла синхронізовано збирати дані з RGB-D гарнітур, тактильного зворотного зв’язку, повного захоплення руху та камер на грудях і зап’ястях у таких масштабах. Їхні датасети викликають інтерес у провідних лабораторій та університетів через свою новизну та обсяги”, — зазначив партнер Wing VC Зак ДеВітт.
Human Archive також працює над методами тонкого налаштування AI-моделей за допомогою власних даних і тестує їх на роботах для оцінки ефективності виконання завдань. Це дозволяє компанії демонструвати якість своїх рішень потенційним клієнтам та вдосконалювати внутрішні моделі.
Зараз стартап розширює діяльність у країнах Південно-Східної Азії та США, а також розробляє платформу, яка дозволить будь-кому брати участь у зборі даних і заробляти гроші. У США Human Archive планує впровадити послуги прибирання чи готування їжі в обмін на відеозйомку процесів, проте ці програми поки перебувають на етапі пілотних проєктів.
Компанія дотримується вимог індійського закону про захист персональних даних, надає учасникам інформацію про цілі збору даних і способи їх обробки, а всі відео проходять анонімізацію та розмиття облич. Водночас, регулятори Індії почали перевірки щодо прозорості збору згоди та практик роботи з персональними даними.
Human Archive є одним із лідерів у створенні масштабних датасетів для AI, необхідних для розвитку фізичних роботів. Подальший успіх компанії залежить від здатності залучати нових партнерів і постачати унікальні, об’ємні дані для потреб лабораторій штучного інтелекту.