Компания Cohere, специализирующаяся на корпоративном искусственном интеллекте, анонсировала запуск новой открытой семьи мультиязычных моделей Tiny Aya на India AI Summit. Эти модели с открытым кодом поддерживают более 70 языков мира и могут работать на обычных устройствах, в том числе ноутбуках, без подключения к интернету.
Об этом сообщает ProIT
Расширенная языковая поддержка и региональные версии
Исследовательский подразделение Cohere Labs создало Tiny Aya с особым акцентом на южноазиатские языки, среди которых бенгальский, хинди, панджаби, урду, гуджарати, тамильский, телугу и маратхи. Базовая модель содержит 3,35 миллиарда параметров, что свидетельствует о ее значительной сложности и глубине.
Кроме базовой версии, Cohere представила TinyAya-Global — специализированный вариант, оптимизированный для более точного выполнения команд пользователя в приложениях с широкой языковой поддержкой. Семейство моделей также дополняют TinyAya-Earth для африканских языков, TinyAya-Fire для южноазиатских языков и TinyAya-Water для языков Азии, Западной Азии и Европы.
«Этот подход позволяет каждой модели развивать более сильные лингвистические основы и культурные нюансы, создавая системы, которые кажутся более естественными и надежными для сообществ, которым они предназначены. В то же время все модели Tiny Aya сохраняют широкое мультиязычное покрытие, что делает их гибкими отправными точками для дальнейшей адаптации и исследований,» — заявила компания в своем пресс-релизе.
Технические особенности и доступность для разработчиков
Модели Tiny Aya были обучены на кластере из 64 графических процессоров H100 от Nvidia, используя относительно умеренные вычислительные ресурсы. Благодаря такому подходу модели идеально подходят для исследователей и разработчиков, создающих приложения для носителей местных языков. Они могут работать непосредственно на устройствах, что позволяет реализовывать офлайн-перевод — без необходимости постоянного подключения к сети. Программное обеспечение, на основе которого построены модели, специально оптимизировано для работы на устройствах с небольшой вычислительной мощностью, что отличает его от большинства аналогичных решений.
В условиях языкового разнообразия, например, в Индии, такая офлайн-функциональность расширяет возможности применения и открывает новые сценарии использования, где стабильный доступ к интернету не всегда возможен.
Модели Tiny Aya уже доступны для загрузки и тестирования на платформе HuggingFace, а также на платформе Cohere. Разработчики могут получить их на HuggingFace, Kaggle и Ollama для локального развертывания. Компания также предоставила открытый доступ к учебным и тестовым наборам данных на HuggingFace и планирует опубликовать технический отчет с подробным описанием методологии обучения.
Генеральный директор Cohere Эйдан Гомес в прошлом году заявил о намерении компании выйти на биржу в ближайшее время. По данным CNBC, компания завершила 2025 год, достигнув $240 миллионов годового регулярного дохода и продемонстрировав 50% квартального роста в течение года.