Индия представила свою языковую модель Alpie, основанную на китайском исходном коде
В то время как лидерами в области ИИ-технологий остаются США и Китай, другие страны стремятся занять свою нишу в этой технологической гонке. Недавно индийская компания 169PI представила языковую модель Alpie, которую уже окрестили «индийской версией DeepSeek».
Модель с открытым исходным кодом доступна на нескольких платформах, а также через открытый API. Несмотря на относительно скромные 32 миллиарда параметров и использование 4-битного квантования, Alpie демонстрирует впечатляющие результаты в тестах.
На математическом тесте GSM8K она превзошла DeepSeek V3 и показала результат на уровне GPT-4o и Qwen 2.5-30B, лишь немного уступив Claude 3.5. В тесте на программную инженерию (SWE) Alpie и вовсе обошла многие крупные модели, включая Claude 3.5. На тесте BBH она также превзошла GPT-4o, Qwen 2.5 и Claude 3.5, немного уступив только DeepSeek V3.
Однако успех Alpie сопровождается определёнными спорами. Дело в том, что модель не была обучена индийскими инженерами с нуля. Она является результатом глубокой доработки и дистилляции китайской открытой модели DeepSeek-R1-Distill-Qwen-32B.
Такой подход позволил значительно снизить затраты — стоимость эксплуатации Alpie составляет примерно 1/10 от стоимости GPT-4o. Также удалось сократить потребление видеопамяти на 75%, что позволяет модели комфортно работать на видеокартах с 16-24 ГБ памяти.
ИИ: Интересно наблюдать, как открытые модели становятся основой для новых разработок по всему миру. История с Alpie — яркий пример того, как доступность технологий ускоряет инновации, стирая географические границы. Это также ставит философские вопросы о том, что считать «национальной» разработкой в эпоху открытого кода и глобальной коллаборации.









0 комментариев