Обзор возможностей Google Gemini 2.5 Flash Nano Banana для редактирования изображений

|
Обзор возможностей Google Gemini 2.5 Flash Nano Banana для редактирования изображений

Google представил усовершенствованный генератор изображений Gemini 2.5 Flash Nano Banana, который позволяет пользователям редактировать и трансформировать изображения в пошаговом режиме. Это веб-приложение позиционируется как альтернатива Adobe Photoshop для широкой аудитории, обеспечивая интуитивный интерфейс и простоту использования, особенно для непрофессиональных пользователей.

Об этом сообщает ProIT

Функциональные возможности Nano Banana: от удаления текста до объединения изображений

В рамках тестирования было рассмотрено несколько сценариев работы с Nano Banana. На первом этапе проверили удаление текста с постеров и вырезание отдельных объектов. На примере постеров S.T.A.L.K.E.R. 2 и Metal Gear Solid Delta: Snake Eater инструмент легко справился с задачами удаления надписей. Далее была протестирована функция объединения двух изображений, которая также сработала корректно, однако возникли нюансы с масштабированием различных элементов. В частности, при попытке изменить размеры персонажей искусственный интеллект не всегда точно выполнял запрос, хотя контекст понимал правильно.

Изменив подход к формулировке запроса, а именно заменив «увеличить» на «расширить», удалось достичь лучшего результата при редактировании объектов на изображении.

«Наиболее очевидной проблемой с использованием ИИ является непонимание того, что именно хочет пользователь. Кроме того, он или она могут неправильно формулировать запросы. В примере “увеличении сталкеру” Nano Banana не мог понять, что именно от него хотят. Выходом из ситуации стала замена фразы: увеличить -> расширить. В будущих ситуациях старайтесь более доступно объяснять ИИ, что именно вы хотите».

Замена лиц и создание постеров

Среди дополнительных возможностей — замена лиц на изображениях. Например, инструмент позволяет заменить героя с постера Metal Gear Solid Delta: Snake Eater на Арнольда Шварценеггера или Сильвестра Сталлоне, а также изменить определенные детали, такие как цвет повязки для создания аутентичного образа. При необходимости можно объединить несколько персонажей на одном изображении, и хотя ИИ иногда генерирует новый вариант, результат часто превосходит ожидания.

Еще один сценарий — имитация создания постера. Nano Banana позволяет искать нужные изображения, редактировать их непосредственно в веб-приложении и изменять фон, добавлять новые объекты (например, камень или след животного), а также интегрировать логотип в нужное место. В процессе тестирования искусственный интеллект хорошо понимает расположение объектов, хотя могут возникать мелкие недочеты в деталях, которые легко корректируются дополнительными запросами.

Проблемы и особенности использования

Основной проблемой при работе с Nano Banana является необходимость четко формулировать запросы, так как от этого зависит корректность полученного результата. В частности, некорректно сформулированное задание может привести к недоразумениям со стороны ИИ. Кроме того, в редких случаях пользователи сталкиваются с техническими сбоями — например, когда система сообщает о готовности изображения, но не отображает его. Это решается простым повторным добавлением тега изображения.

В целом, Nano Banana (Google Gemini 2.5 Flash Image) демонстрирует высокий уровень удобства для повседневных задач редактирования изображений в текстовом формате. Хотя инструмент может восприниматься как развлечение профессионалами, для рядовых пользователей он открывает широкие возможности творчества и самовыражения. Несмотря на определенные недостатки, потенциал платформы значителен, а знакомство с ней — ценный опыт для тех, кто ищет простые решения для обработки фотографий и иллюстраций.