Google расширила возможности своего искусственного интеллекта Gemini, добавив функцию загрузки аудиофайлов и других типов файлов. Теперь эта опция доступна пользователям на Android, iOS и в веб-версии сервиса.
Об этом сообщает ProIT
Детали новых возможностей Gemini
По словам Джоша Вудворда, вице-президента Google Labs и Gemini, пользователи могут загружать в приложение различные файлы, включая популярные аудиоформаты, такие как MP3 и WAV. Для этого нужно нажать на иконку “+” и выбрать Upload files в веб-версии или Files на смартфоне. Разрешено добавлять до десяти файлов за один раз.
Бесплатная версия ограничивает общую продолжительность аудио до 10 минут на запрос. Если оформить подписку Google AI Pro или AI Ultra, этот лимит увеличивается до трех часов. В то же время для видеофайлов действуют другие ограничения: бесплатные пользователи могут загружать видео продолжительностью до 5 минут, а владельцы подписки — до одного часа.
Дальнейшие обновления экосистемы Google на базе Gemini
Кроме поддержки аудио, Google внедрила еще два значительных обновления продуктов на основе Gemini. Поисковый сервис Google Search в режиме AI Mode расширил языковую поддержку. Теперь он работает еще на пяти языках: хинди, индонезийском, японском, корейском и бразильском португальском. Это стало возможным благодаря интеграции Gemini 2.5, которая позволяет пользователям получать более глубокие ответы на сложные вопросы на родном языке.
Также ИИ-блокнот NotebookLM, созданный на базе Gemini, получил новые стили отчетов. Теперь можно формировать учебные материалы, блоги, тесты, карточки для запоминания и другие форматы более чем на 80 языках. NotebookLM анализирует загруженные пользователем документы, файлы и другие материалы, а результаты подает в выбранном стиле. Пользователям доступна возможность выбирать структуру, тон и стиль отчетов. По заявлению Google, обновление станет доступным для всех в течение недели.
«Теперь вы можете загрузить любой файл в Gemini»
Функция работы с аудио в NotebookLM была реализована еще до ее внедрения в основном приложении Gemini, ведь именно NotebookLM позиционируется как инструмент для исследований и анализа закономерностей в различных типах файлов.
В течение последних месяцев Google активно дополняет экосистему своих ИИ-сервисов. В августе Gemini начал автоматически запоминать предпочтения пользователей из прошлых диалогов, а бесплатные аккаунты получили доступ к Workspace Vids для генерации видео. В сентябре Google Photos перешел на новую версию генератора видео Veo 3, позволив бесплатно создавать короткие видео из фотографий продолжительностью до 4 секунд.