Google розширила можливості свого штучного інтелекту Gemini, додавши функцію завантаження аудіофайлів та інших типів файлів. Тепер ця опція доступна користувачам на Android, iOS та у вебверсії сервісу.
Про це розповідає ProIT
Деталі нових можливостей Gemini
За словами Джоша Вудворда, віцепрезидента Google Labs і Gemini, користувачі можуть завантажувати у застосунок різні файли, включно з популярними аудіоформатами, такими як MP3 та WAV. Для цього потрібно натиснути іконку “+” і вибрати Upload files у вебверсії або Files на смартфоні. Дозволено додавати до десяти файлів за один раз.
Безкоштовна версія обмежує загальну тривалість аудіо до 10 хвилин на запит. Якщо оформити підписку Google AI Pro або AI Ultra, цей ліміт збільшується до трьох годин. Водночас для відеофайлів діють інші обмеження: безкоштовні користувачі можуть завантажувати відео тривалістю до 5 хвилин, а власники підписки — до однієї години.
Подальші оновлення екосистеми Google на базі Gemini
Окрім підтримки аудіо, Google впровадила ще два значних оновлення продуктів на основі Gemini. Пошуковий сервіс Google Search у режимі AI Mode розширив мовну підтримку. Тепер він працює ще п’ятьма мовами: хінді, індонезійською, японською, корейською та бразильською португальською. Це стало можливим завдяки інтеграції Gemini 2.5, що дозволяє користувачам отримувати глибші відповіді на складні питання рідною мовою.
Також ШІ-блокнот NotebookLM, створений на базі Gemini, отримав нові стилі звітів. Тепер можна формувати навчальні матеріали, блоги, тести, картки для запам’ятовування та інші формати більш ніж 80 мовами. NotebookLM аналізує завантажені користувачем документи, файли й інші матеріали, а результати подає у вибраному стилі. Користувачам доступна можливість обирати структуру, тон і стиль звітів. За заявою Google, оновлення стане доступним для всіх протягом тижня.
“Тепер ви можете завантажити будь-який файл до Gemini”
Функція роботи з аудіо у NotebookLM була реалізована ще до її впровадження в основному додатку Gemini, адже саме NotebookLM позиціонується як інструмент для досліджень і аналізу закономірностей у різних типах файлів.
Упродовж останніх місяців Google активно доповнює екосистему своїх ШІ-сервісів. У серпні Gemini почав автоматично запам’ятовувати вподобання користувачів з минулих діалогів, а безкоштовні акаунти отримали доступ до Workspace Vids для генерації відео. У вересні Google Photos перейшов на нову версію генератора відео Veo 3, дозволивши безкоштовно створювати короткі відео з фотографій тривалістю до 4 секунд.