Google презентував масштабне оновлення генератора зображень на основі штучного інтелекту — Gemini 2.5 Flash, який також відомий під назвою Nano Banana. Новий продукт уже очолив рейтинг LMArena та отримує схвальні відгуки від користувачів за інноваційний підхід до поєднання елементів без спотворень і багатокрокового редагування.
Про це розповідає ProIT
Основні переваги Nano Banana
Nano Banana створено для вирішення фундаментальної проблеми генеративного ШІ — узгодженості елементів на зображеннях. Google прагне не лише підвищити точність і якість редагування, а й зробити процес створення високоякісного візуального контенту доступним для широкої аудиторії. Gemini 2.5 Flash доступний у застосунку, а також для розробників через Gemini API, Google AI Studio та Vertex AI. За відгуками, система забезпечує надзвичайно органічне поєднання різних елементів під час багатокрокового редагування, дозволяючи уникати типових спотворень.
“Я перевірив, як Nano Banana може перетворити одне базове зображення на повноцінну кінематографічну послідовність. Узгодженість між сценами бездоганна, немає потреби перебудовувати все з нуля кадр за кадром. Це змінює все для швидкості та тону розповіді історій. Робочий процес? У 10 разів швидший”, — пише @D_studioproject в X.
Новий інструмент дозволяє змінювати деталі на фотографіях, не порушуючи цілісності інших елементів. Наприклад, користувачі можуть завантажити портрет і експериментувати з різними варіантами одягу, зачіски чи навіть змінити оточення героя. Всі зміни відбуваються без характерних для ШІ-генерації спотворень, що робить результати максимально реалістичними.
Багатокрокове редагування та захист контенту
Gemini 2.5 Flash пропонує багатокрокове редагування — це означає, що користувачі можуть поступово додавати нові елементи, наприклад, декор у кімнаті чи окремі деталі інтер’єру, бачачи, як змінюється фінальний результат на кожному етапі. Особливістю є й можливість змішування стилів: стиль одного зображення можна накласти на об’єкт іншого, що відкриває нові горизонти для творчості.
Офіційний акаунт Google Gemini App продемонстрував приклади унікального поєднання ідей та зображень, таких як космонавт, що грає у баскетбол на майданчику в джунглях. Програма дозволяє поєднувати різні текстури, теми й оточення, створюючи цілісні й гармонійні композиції.
Ще однією важливою функцією стало впровадження невидимого цифрового водяного знака SynthID, який залишається навіть після змін і редагувань зображення. Це допомагає у боротьбі з підробками та підтверджує оригінальність створеного контенту.
Відзначається, що свого часу стрімке зростання популярності застосунків для створення зображень, таких як ChatGPT, було пов’язане саме з простотою використання і можливістю створювати стильні роботи, наприклад, у стилі Studio Ghibli. Аналітики прогнозують, що Google Nano Banana має потенціал повторити цей успіх і стати новим стандартом для масового використання генеративного ШІ у створенні фото- та відеоконтенту.