Стартап Inception, который специализируется на разработке диффузионных моделей искусственного интеллекта для работы с кодом и текстом, получил $50 миллионов стартовых инвестиций. Лидером раунда выступила компания Menlo Ventures, а к финансированию также присоединились такие известные специалисты, как Эндрю Нг и Андрей Карпаты.
Об этом сообщает ProIT
Диффузионный подход в искусственном интеллекте
Проект возглавляет профессор Стэнфордского университета Стефано Эрмон, который известен исследованиями в области диффузионных моделей. В отличие от традиционных автогенеративных моделей, которые формируют текст пошагово, диффузионные модели выполняют итеративное усовершенствование ответа, постепенно приближая его к желаемому результату. Именно такой подход используют современные генераторы изображений, такие как Stable Diffusion, Midjourney и Sora.
Inception нацелена на расширение применения диффузионных моделей для задач, связанных с программированием и обработкой текста. Вместе с привлеченными инвестициями компания представила новую версию своей модели Mercury, ориентированной на программистов. Mercury уже интегрирована в такие инструменты, как ProxyAI, Buildglare и Kilo Code, что свидетельствует о ее практической эффективности.
Преимущества и перспективы диффузионных моделей
По словам Эрмона, диффузионные LLM-модели имеют значительное преимущество по скорости работы и эффективности использования вычислительных ресурсов по сравнению с современными автогенеративными решениями. Они позволяют обрабатывать множество операций параллельно, что особенно актуально при работе с большими массивами кода или текста. Эрмон уверен, что такой подход становится все более конкурентоспособным:
“Эти диффузионные LLM гораздо быстрее и гораздо эффективнее, чем то, что сегодня строит каждый другой”, — говорит Эрмон. “Это совершенно другой подход, где еще много инноваций можно предложить”.
Диффузионные модели, в отличие от автогенеративных, способны использовать аппаратное обеспечение более гибко, распределяя ресурсы для параллельной обработки. Это обеспечивает значительно меньшую задержку ответа, что критически важно для сложных и масштабных задач. По результатам тестирования, модель Mercury способна генерировать более 1000 токенов в секунду, что существенно превышает возможности существующих автогенеративных технологий.
Развитие диффузионных моделей в сфере программирования и текстовых задач открывает новые перспективы для снижения затрат на вычисления и повышения производительности разработческих инструментов. Участники инвестиционного раунда уверены, что Inception станет одним из лидеров этого технологического направления.