Cohere представила семейство открытых многоязычных моделей Tiny Aya
Компания Cohere, специализирующаяся на корпоративном искусственном интеллекте, представила новое семейство многоязычных моделей на полях проходящего в Индии саммита India AI Summit. Модели под названием Tiny Aya являются открытыми по весам — это означает, что их исходный код находится в открытом доступе для использования и модификации. Они поддерживают более 70 языков и могут работать на обычных устройствах, таких как ноутбуки, без необходимости подключения к интернету.
Модель, выпущенная исследовательским подразделением компании Cohere Labs, поддерживает южноазиатские языки, включая бенгальский, хинди, панджаби, урду, гуджарати, тамильский, телугу и маратхи.
Базовая модель содержит 3,35 миллиарда параметров — показатель её размера и сложности. Cohere также представила версию TinyAya-Global, доработанную для лучшего выполнения пользовательских команд, для приложений, требующих широкой языковой поддержки. Семейство дополняют региональные варианты: TinyAya-Earth для африканских языков; TinyAya-Fire для языков Южной Азии; и TinyAya-Water для Азиатско-Тихоокеанского региона, Западной Азии и Европы.
Изображение: Cohere
«Такой подход позволяет каждой модели развивать более глубокое языковое понимание и культурные нюансы, создавая системы, которые кажутся более естественными и надёжными для сообществ, которым они предназначены. В то же время все модели Tiny Aya сохраняют широкое многоязычное покрытие, что делает их гибкой отправной точкой для дальнейшей адаптации и исследований», — заявила компания.
Cohere отметила, что эти модели, обученные на одном кластере из 64 графических процессоров H100 (высокопроизводительные чипы от Nvidia) с использованием относительно скромных вычислительных ресурсов, идеально подходят для исследователей и разработчиков, создающих приложения для аудитории, говорящей на родных языках. Модели способны работать непосредственно на устройствах, поэтому разработчики могут использовать их для офлайн-перевода. Компания подчеркнула, что создала базовое программное обеспечение с расчётом на использование на устройстве, требующее меньше вычислительной мощности, чем большинство сопоставимых моделей.
Изображение: Cohere
В таких лингвистически разнообразных странах, как Индия, эта офлайн-возможность может открыть множество приложений и сценариев использования без необходимости постоянного доступа в интернет.
Модели доступны на популярной платформе для обмена и тестирования ИИ-моделей HuggingFace, а также на платформе Cohere. Разработчики могут загрузить их на HuggingFace, Kaggle и Ollama для локального развёртывания. Компания также публикует наборы данных для обучения и оценки на HuggingFace и планирует выпустить технический отчёт с деталями методологии обучения.
Генеральный директор стартапа, Эйдан Гомес, в прошлом году заявил, что компания планирует провести IPO «в ближайшее время». По данным CNBC, компания завершила 2025 год на высокой ноте, показав годовой регулярный доход в размере 240 миллионов долларов США (~19,2 млрд рублей) с квартальным ростом в 50% на протяжении всего года.









0 комментариев