Компания Black Forest Labs, стартап в области искусственного интеллекта, известный благодаря своим моделям, которые ранее использовались в функциях генерации изображений чат-бота Grok от X, недавно представила новую линейку моделей для создания изображений. Некоторые из этих моделей имеют возможность не только генерировать, но и редактировать изображения.
Об этом сообщает ProIT
Мощные новые модели Flux.1 Kontext
Наиболее мощная модель в новой линейке, названная Flux.1 Kontext, может принимать текстовые запросы и, по желанию, референсные изображения для создания новых картин. Black Forest Labs отмечает в блоге, что «модели Flux.1 Kontext обеспечивают результаты генерации изображений мирового уровня с высокой точностью к запросам, фотореалистичным отображением и конкурентными шрифтами — все это с скоростью обработки до 8 раз быстрее, чем у ведущих моделей».
Это происходит на фоне растущей конкуренции в сфере генерации изображений. Например, в этом месяце Google представил свою новую модель генерации изображений, Imagen 4, на конференции разработчиков I/O. Ранее в этом году OpenAI запустила значительно усовершенствованную модель генерации изображений для ChatGPT, которая быстро стала популярной благодаря способности создавать искусство в стиле аниме Studio Ghibli.
Функции и возможности модели
Black Forest Labs анонсировала, что новая модель Flux.1 Kontext позволяет пользователям редактировать изображения, используя текстовые команды. Пользователи могут изменять одежду персонажей, перерабатывать сцены и переписывать текст, просто дав соответствующий запрос.
“Сегодня мы представляем FLUX.1 Kontext — набор моделей генеративного потока, которые позволяют генерировать и редактировать изображения.”
В линейке Flux.1 Kontext есть две модели: Flux.1 Kontext [pro] и Flux.1 Kontext [max]. Первая из них позволяет пользователям генерировать изображения и уточнять их через несколько «ходов», сохраняя при этом персонажей и стили. Модель Kontext [max] сосредоточена на скорости и точности соблюдения запросов.
Хотя модели Flux.1 Kontext [pro] и [max] не могут быть загружены для офлайн-использования, Black Forest Labs планирует выпустить открытую модель Kontext [dev], доступную в частном бета-тестировании для исследований и тестирования безопасности. Кроме того, компания запускает площадку для моделей, где пользователи могут испытать возможности моделей без необходимости подписки на сторонний сервис. Новые пользователи получают 200 кредитов, что позволяет сгенерировать около 12 изображений с помощью модели Flux.1 Kontext [pro].
Black Forest Labs, базирующаяся в Германии, ранее сообщала, что ведет переговоры о привлечении $100 миллионов при оценке в $1 миллиард в конце прошлого года. Многие основатели компании пришли из Stability AI, создателя известной модели генерации изображений Stable Diffusion. Среди инвесторов — Andreessen Horowitz, соучредитель Oculus Брендан Ирибе и Гарри Тан из Y Combinator.