Google представил усовершенствованный генератор изображений Gemini 2.5 Flash Nano Banana, который позволяет пользователям редактировать и трансформировать изображения в пошаговом режиме. Это веб-приложение позиционируется как альтернатива Adobe Photoshop для широкой аудитории, обеспечивая интуитивный интерфейс и простоту использования, особенно для непрофессиональных пользователей.
Об этом сообщает ProIT
Функциональные возможности Nano Banana: от удаления текста до объединения изображений
В рамках тестирования было рассмотрено несколько сценариев работы с Nano Banana. На первом этапе проверили удаление текста с постеров и вырезание отдельных объектов. На примере постеров S.T.A.L.K.E.R. 2 и Metal Gear Solid Delta: Snake Eater инструмент легко справился с задачами удаления надписей. Далее была протестирована функция объединения двух изображений, которая также сработала корректно, однако возникли нюансы с масштабированием различных элементов. В частности, при попытке изменить размеры персонажей искусственный интеллект не всегда точно выполнял запрос, хотя контекст понимал правильно.
Изменив подход к формулировке запроса, а именно заменив «увеличить» на «расширить», удалось достичь лучшего результата при редактировании объектов на изображении.
«Наиболее очевидной проблемой с использованием ИИ является непонимание того, что именно хочет пользователь. Кроме того, он или она могут неправильно формулировать запросы. В примере “увеличении сталкеру” Nano Banana не мог понять, что именно от него хотят. Выходом из ситуации стала замена фразы: увеличить -> расширить. В будущих ситуациях старайтесь более доступно объяснять ИИ, что именно вы хотите».
Замена лиц и создание постеров
Среди дополнительных возможностей — замена лиц на изображениях. Например, инструмент позволяет заменить героя с постера Metal Gear Solid Delta: Snake Eater на Арнольда Шварценеггера или Сильвестра Сталлоне, а также изменить определенные детали, такие как цвет повязки для создания аутентичного образа. При необходимости можно объединить несколько персонажей на одном изображении, и хотя ИИ иногда генерирует новый вариант, результат часто превосходит ожидания.
Еще один сценарий — имитация создания постера. Nano Banana позволяет искать нужные изображения, редактировать их непосредственно в веб-приложении и изменять фон, добавлять новые объекты (например, камень или след животного), а также интегрировать логотип в нужное место. В процессе тестирования искусственный интеллект хорошо понимает расположение объектов, хотя могут возникать мелкие недочеты в деталях, которые легко корректируются дополнительными запросами.
Проблемы и особенности использования
Основной проблемой при работе с Nano Banana является необходимость четко формулировать запросы, так как от этого зависит корректность полученного результата. В частности, некорректно сформулированное задание может привести к недоразумениям со стороны ИИ. Кроме того, в редких случаях пользователи сталкиваются с техническими сбоями — например, когда система сообщает о готовности изображения, но не отображает его. Это решается простым повторным добавлением тега изображения.
В целом, Nano Banana (Google Gemini 2.5 Flash Image) демонстрирует высокий уровень удобства для повседневных задач редактирования изображений в текстовом формате. Хотя инструмент может восприниматься как развлечение профессионалами, для рядовых пользователей он открывает широкие возможности творчества и самовыражения. Несмотря на определенные недостатки, потенциал платформы значителен, а знакомство с ней — ценный опыт для тех, кто ищет простые решения для обработки фотографий и иллюстраций.