Cohere представила семейство открытых многоязычных моделей Tiny Aya

Компания Cohere, специализирующаяся на корпоративном искусственном интеллекте, представила новое семейство многоязычных моделей на полях проходящего в Индии саммита India AI Summit. Модели под названием Tiny Aya являются открытыми по весам — это означает, что их исходный код находится в открытом доступе для использования и модификации. Они поддерживают более 70 языков и могут работать на обычных устройствах, таких как ноутбуки, без необходимости подключения к интернету.

Модель, выпущенная исследовательским подразделением компании Cohere Labs, поддерживает южноазиатские языки, включая бенгальский, хинди, панджаби, урду, гуджарати, тамильский, телугу и маратхи.

Базовая модель содержит 3,35 миллиарда параметров — показатель её размера и сложности. Cohere также представила версию TinyAya-Global, доработанную для лучшего выполнения пользовательских команд, для приложений, требующих широкой языковой поддержки. Семейство дополняют региональные варианты: TinyAya-Earth для африканских языков; TinyAya-Fire для языков Южной Азии; и TinyAya-Water для Азиатско-Тихоокеанского региона, Западной Азии и Европы.

Изображение: Cohere

«Такой подход позволяет каждой модели развивать более глубокое языковое понимание и культурные нюансы, создавая системы, которые кажутся более естественными и надёжными для сообществ, которым они предназначены. В то же время все модели Tiny Aya сохраняют широкое многоязычное покрытие, что делает их гибкой отправной точкой для дальнейшей адаптации и исследований», — заявила компания.

Cohere отметила, что эти модели, обученные на одном кластере из 64 графических процессоров H100 (высокопроизводительные чипы от Nvidia) с использованием относительно скромных вычислительных ресурсов, идеально подходят для исследователей и разработчиков, создающих приложения для аудитории, говорящей на родных языках. Модели способны работать непосредственно на устройствах, поэтому разработчики могут использовать их для офлайн-перевода. Компания подчеркнула, что создала базовое программное обеспечение с расчётом на использование на устройстве, требующее меньше вычислительной мощности, чем большинство сопоставимых моделей.

Изображение: Cohere

В таких лингвистически разнообразных странах, как Индия, эта офлайн-возможность может открыть множество приложений и сценариев использования без необходимости постоянного доступа в интернет.

Модели доступны на популярной платформе для обмена и тестирования ИИ-моделей HuggingFace, а также на платформе Cohere. Разработчики могут загрузить их на HuggingFace, Kaggle и Ollama для локального развёртывания. Компания также публикует наборы данных для обучения и оценки на HuggingFace и планирует выпустить технический отчёт с деталями методологии обучения.

Генеральный директор стартапа, Эйдан Гомес, в прошлом году заявил, что компания планирует провести IPO «в ближайшее время». По данным CNBC, компания завершила 2025 год на высокой ноте, показав годовой регулярный доход в размере 240 миллионов долларов США (~19,2 млрд рублей) с квартальным ростом в 50% на протяжении всего года.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии