Cohere представила открытое семейство мультиязычных AI-моделей Tiny Aya

|
Cohere представила открытое семейство мультиязычных AI-моделей Tiny Aya

Компания Cohere, специализирующаяся на корпоративном искусственном интеллекте, анонсировала запуск новой открытой семьи мультиязычных моделей Tiny Aya на India AI Summit. Эти модели с открытым кодом поддерживают более 70 языков мира и могут работать на обычных устройствах, в том числе ноутбуках, без подключения к интернету.

Об этом сообщает ProIT

Расширенная языковая поддержка и региональные версии

Исследовательский подразделение Cohere Labs создало Tiny Aya с особым акцентом на южноазиатские языки, среди которых бенгальский, хинди, панджаби, урду, гуджарати, тамильский, телугу и маратхи. Базовая модель содержит 3,35 миллиарда параметров, что свидетельствует о ее значительной сложности и глубине.

Кроме базовой версии, Cohere представила TinyAya-Global — специализированный вариант, оптимизированный для более точного выполнения команд пользователя в приложениях с широкой языковой поддержкой. Семейство моделей также дополняют TinyAya-Earth для африканских языков, TinyAya-Fire для южноазиатских языков и TinyAya-Water для языков Азии, Западной Азии и Европы.

«Этот подход позволяет каждой модели развивать более сильные лингвистические основы и культурные нюансы, создавая системы, которые кажутся более естественными и надежными для сообществ, которым они предназначены. В то же время все модели Tiny Aya сохраняют широкое мультиязычное покрытие, что делает их гибкими отправными точками для дальнейшей адаптации и исследований,» — заявила компания в своем пресс-релизе.

Технические особенности и доступность для разработчиков

Модели Tiny Aya были обучены на кластере из 64 графических процессоров H100 от Nvidia, используя относительно умеренные вычислительные ресурсы. Благодаря такому подходу модели идеально подходят для исследователей и разработчиков, создающих приложения для носителей местных языков. Они могут работать непосредственно на устройствах, что позволяет реализовывать офлайн-перевод — без необходимости постоянного подключения к сети. Программное обеспечение, на основе которого построены модели, специально оптимизировано для работы на устройствах с небольшой вычислительной мощностью, что отличает его от большинства аналогичных решений.

В условиях языкового разнообразия, например, в Индии, такая офлайн-функциональность расширяет возможности применения и открывает новые сценарии использования, где стабильный доступ к интернету не всегда возможен.

Модели Tiny Aya уже доступны для загрузки и тестирования на платформе HuggingFace, а также на платформе Cohere. Разработчики могут получить их на HuggingFace, Kaggle и Ollama для локального развертывания. Компания также предоставила открытый доступ к учебным и тестовым наборам данных на HuggingFace и планирует опубликовать технический отчет с подробным описанием методологии обучения.

Генеральный директор Cohere Эйдан Гомес в прошлом году заявил о намерении компании выйти на биржу в ближайшее время. По данным CNBC, компания завершила 2025 год, достигнув $240 миллионов годового регулярного дохода и продемонстрировав 50% квартального роста в течение года.