Проблемы обработки данных в Lyft и стартап Eventual

Во время работы инженерами программного обеспечения в программе автономных транспортных средств компании Lyft, Семми Сидху и Джей Чиа столкнулись с масштабной проблемой обработки данных, которая с годами лишь усложнялась из-за распространения искусственного интеллекта.

Об этом сообщает ProIT

Создание решения для обработки неструктурированных данных

Автономные автомобили генерируют огромный объем неструктурированных данных: от 3D-сканов и фотографий до текста и аудио. Инженеры Lyft не имели универсального инструмента для одновременной обработки всех этих форматов, что заставляло их сочетать различные open source-решения, тратя значительные ресурсы на поддержку инфраструктуры вместо развития основных приложений.

“У нас были все эти блестящие кандидаты наук, блестящие специалисты в отрасли, работающие над автономными транспортными средствами, но они тратили около 80% своего времени на работу с инфраструктурой, а не на создание своего основного приложения,” — сказал Сидху, который является CEO Eventual, в недавнем интервью TechCrunch. “И большинство из этих проблем, с которыми они сталкивались, касались именно инфраструктуры данных.”

Ощущая острую необходимость в комплексном инструменте, Сидху и Чиа создали внутреннюю платформу для мультимодальной обработки данных. Когда Сидху начал искать новую работу, ему неоднократно предлагали внедрить подобное решение и в других компаниях. Так появилась идея стартапа Eventual.

Daft — движок для мультиформатных данных и развитие компании

Eventual разработала Daft — открытый движок для обработки данных, написанный на языке Python, способный быстро работать с различными типами данных: текстом, аудио, видео и т.д. По словам Сидху, их цель — сделать Daft таким же революционным для неструктурированных данных, как когда-то SQL был для табличных данных.

Компания появилась в начале 2022 года, почти за год до выпуска ChatGPT, когда еще мало кто осознавал масштаб проблем с обработкой неструктурированных данных. Первую open source-версию Daft представили в 2022 году, а запуск корпоративного продукта запланирован на третий квартал текущего года.

Взрывной рост популярности ChatGPT, по мнению Сидху, лишь подчеркнул необходимость таких решений, ведь разработчики начали активно использовать разнообразные форматы данных в своих AI-приложениях.

Хотя Daft изначально создавался для сферы автономного транспорта, сегодня продукт Eventual используют в робототехнике, розничной торговле, медицинских технологиях и многих других отраслях. Среди клиентов компании — Amazon, CloudKitchens, Together AI и другие.

За последние восемь месяцев Eventual провела два инвестиционных раунда. На первом этапе компания привлекла $7,5 млн от CRV, а недавно — $20 млн в рамках раунда серии А под руководством Felicis с участием Microsoft M12 и Citi. Новые инвестиции планируют направить на развитие open source-продукта и создание коммерческого решения для построения AI-приложений на основе обработанных данных.

Аналитики прогнозируют стремительный рост индустрии мультимодальных AI — около 35% в год до 2028 года. Как отмечает Анастасия Майерс, генеральный партнер Felicis, Eventual выделяется среди конкурентов благодаря уникальному опыту основателей и первенству на рынке. Она подчеркивает, что резкий рост объемов неструктурированных данных требует именно таких решений:

По оценкам MarketsandMarkets, в мире сейчас генерируется в тысячу раз больше данных, чем 20 лет назад, и 90% всех данных появились лишь за последние два года. Большинство из них — неструктурированные, и именно Daft создан для эффективной работы с таким объемом информации, в том числе текстом, изображениями, видео и аудио.