Human Archive привлекает $8,2 млн для сбора данных gig-экономики Индии для обучения роботов

|
Human Archive привлекает $8,2 млн для сбора данных gig-экономики Индии для обучения роботов

Стартап Human Archive из США активно использует рост gig-экономики Индии, собирая уникальные видео- и сенсорные данные для обучения робототехники. Компания сотрудничает с рядом сервисных платформ, чтобы оснастить работников специальными головными уборами с камерами. Это позволяет фиксировать процессы повседневной работы от первого лица, что создает ценный материал для развития искусственного интеллекта и роботов.

Об этом сообщает ProIT

Сбор данных через сотрудничество с gig-платформами

Human Archive уже привлекла более 1 000 активных гарнитур, которые работают в сферах домашних услуг, гостиничного и ресторанного бизнеса. Недавно компания получила новый раунд финансирования в размере $8,2 млн от Wing Venture Capital, NVP Capital, Y Combinator и инвесторов из OpenAI, Nvidia, Google, Mercor, AfterQuery, BAIR, SAIL, Brad Boa и Meta. Основатели Human Archive — Самей Мани, Рушил Агарвал, Шлок Пател и Радж Пател (генеральный директор) — выпускники университетов Беркли и Стэнфорда, имеют опыт в областях робототехники и обработки тактильных данных.

Компания обосновывает свою деятельность тем, что современной индустрии AI не хватает качественных реальных данных для обучения машин выполнению физических задач. Human Archive считает, что работники gig-экономики Индии — это неиспользуемый, но масштабируемый ресурс для такого сбора данных.

Инновационные устройства и расширение географии

Несмотря на отказ от сотрудничества с крупными игроками рынка, такими как Pronto и Urban Company, Human Archive продолжила работу с меньшими стартапами, предлагая клиентам выбор: скидка на услуги в случае согласия на видеофиксацию или полная оплата без записи. Пользователи часто выбирают первый вариант, так как видео помогает решать спорные вопросы по качеству сервиса.

Human Archive выплачивает работникам $1 за час участия в сборе данных, тогда как конкуренты могут предлагать $2,6–$4,2. Благодаря локальному присутствию в Индии, компания имеет возможность снижать затраты на оплату труда.

Для сбора максимально ценной информации стартап разрабатывает и использует не только головные гарнитуры, но и тактильные перчатки, костюмы для захвата движения и камеры на запястьях. Синхронизируя видео с сенсорными данными, Human Archive создает богатые датасеты для AI-лабораторий. Уже более 50 различных устройств используются для сбора разнообразных данных.

“Ни одна другая компания в мире не смогла синхронно собирать данные с RGB-D гарнитур, тактильной обратной связи, полного захвата движения и камер на груди и запястьях в таких масштабах. Их датасеты вызывают интерес у ведущих лабораторий и университетов благодаря своей новизне и объемам”, — отметил партнер Wing VC Зак ДеВитт.

Human Archive также работает над методами тонкой настройки AI-моделей с помощью собственных данных и тестирует их на роботах для оценки эффективности выполнения задач. Это позволяет компании демонстрировать качество своих решений потенциальным клиентам и улучшать внутренние модели.

Сейчас стартап расширяет деятельность в странах Юго-Восточной Азии и США, а также разрабатывает платформу, которая позволит любому участвовать в сборе данных и зарабатывать деньги. В США Human Archive планирует внедрить услуги уборки или приготовления пищи в обмен на видеосъемку процессов, однако эти программы пока находятся на этапе пилотных проектов.

Компания соблюдает требования индийского закона о защите персональных данных, предоставляет участникам информацию о целях сбора данных и способах их обработки, а все видео проходят анонимизацию и размытие лиц. В то же время регуляторы Индии начали проверки по поводу прозрачности сбора согласия и практик работы с персональными данными.

Human Archive является одним из лидеров в создании масштабных датасетов для AI, необходимых для развития физических роботов. Дальнейший успех компании зависит от способности привлекать новых партнеров и поставлять уникальные, объемные данные для нужд лабораторий искусственного интеллекта.