Стартап Inception, який спеціалізується на розробці дифузійних моделей штучного інтелекту для роботи з кодом і текстом, отримав $50 мільйонів стартових інвестицій. Лідером раунду виступила компанія Menlo Ventures, а до фінансування також долучилися такі відомі фахівці, як Ендрю Нг та Андрій Карпати.
Про це розповідає ProIT
Дифузійний підхід у штучному інтелекті
Проект очолює професор Стенфордського університету Стефано Ермон, який відомий дослідженнями у сфері дифузійних моделей. На відміну від традиційних автогенеративних моделей, які формують текст покроково, дифузійні моделі виконують ітеративне вдосконалення відповіді, поступово наближаючи її до бажаного результату. Саме такий підхід використовують сучасні генератори зображень, як-от Stable Diffusion, Midjourney та Sora.
Inception має на меті поширити застосування дифузійних моделей на завдання, пов’язані з програмуванням та обробкою тексту. Разом із залученими інвестиціями компанія презентувала нову версію своєї моделі Mercury, орієнтованої на програмістів. Mercury вже інтегровано у такі інструменти, як ProxyAI, Buildglare та Kilo Code, що свідчить про її практичну ефективність.
Переваги та перспективи дифузійних моделей
За словами Ермона, дифузійні LLM-моделі мають значну перевагу за швидкістю роботи та ефективністю використання обчислювальних ресурсів у порівнянні з сучасними автогенеративними рішеннями. Вони дозволяють обробляти численні операції паралельно, що особливо актуально при роботі з великими масивами коду чи тексту. Ермон переконаний, що такий підхід стає все більш конкурентним:
“These diffusion-based LLMs are much faster and much more efficient than what everybody else is building today,” Ermon says. “It’s just a completely different approach where there is a lot of innovation that can still be brought to the table”.
Дифузійні моделі, на відміну від автогенеративних, здатні використовувати апаратне забезпечення більш гнучко, розподіляючи ресурси для паралельної обробки. Це забезпечує значно меншу затримку відповіді, що є критично важливим для складних і масштабних завдань. За результатами тестування, модель Mercury здатна генерувати понад 1000 токенів за секунду, що суттєво перевищує можливості існуючих автогенеративних технологій.
Розвиток дифузійних моделей у сфері програмування та текстових задач відкриває нові перспективи для зниження витрат на обчислення та підвищення продуктивності розробницьких інструментів. Учасники інвестиційного раунду впевнені, що Inception стане одним із лідерів цього технологічного напрямку.