Google представил масштабное обновление генератора изображений на основе искусственного интеллекта — Gemini 2.5 Flash, который также известен под названием Nano Banana. Новый продукт уже возглавил рейтинг LMArena и получает положительные отзывы от пользователей за инновационный подход к сочетанию элементов без искажений и многоступенчатому редактированию.
Об этом сообщает ProIT
Основные преимущества Nano Banana
Nano Banana создан для решения фундаментальной проблемы генеративного ИИ — согласованности элементов на изображениях. Google стремится не только повысить точность и качество редактирования, но и сделать процесс создания высококачественного визуального контента доступным для широкой аудитории. Gemini 2.5 Flash доступен в приложении, а также для разработчиков через Gemini API, Google AI Studio и Vertex AI. По отзывам, система обеспечивает чрезвычайно органичное сочетание различных элементов во время многоступенчатого редактирования, позволяя избегать типичных искажений.
«Я проверил, как Nano Banana может преобразовать одно базовое изображение в полноценную кинематографическую последовательность. Согласованность между сценами безупречна, нет необходимости перестраивать всё с нуля кадр за кадром. Это меняет всё для скорости и тона повествования. Рабочий процесс? В 10 раз быстрее», — пишет @D_studioproject в X.
Новый инструмент позволяет изменять детали на фотографиях, не нарушая целостности других элементов. Например, пользователи могут загрузить портрет и экспериментировать с различными вариантами одежды, прически или даже изменить окружение героя. Все изменения происходят без характерных для ИИ-генерации искажений, что делает результаты максимально реалистичными.
Многоступенчатое редактирование и защита контента
Gemini 2.5 Flash предлагает многоступенчатое редактирование — это означает, что пользователи могут постепенно добавлять новые элементы, например, декор в комнате или отдельные детали интерьера, видя, как изменяется финальный результат на каждом этапе. Особенностью является и возможность смешивания стилей: стиль одного изображения можно наложить на объект другого, что открывает новые горизонты для творчества.
Официальный аккаунт Google Gemini App продемонстрировал примеры уникального сочетания идей и изображений, таких как космонавт, играющий в баскетбол на площадке в джунглях. Программа позволяет сочетать различные текстуры, темы и окружения, создавая целостные и гармоничные композиции.
Еще одной важной функцией стало внедрение невидимого цифрового водяного знака SynthID, который остается даже после изменений и редактирований изображения. Это помогает в борьбе с подделками и подтверждает оригинальность созданного контента.
Отмечается, что в свое время стремительный рост популярности приложений для создания изображений, таких как ChatGPT, был связан именно с простотой использования и возможностью создавать стильные работы, например, в стиле Studio Ghibli. Аналитики прогнозируют, что Google Nano Banana имеет потенциал повторить этот успех и стать новым стандартом для массового использования генеративного ИИ в создании фото- и видеоконтента.