Китайский стартап MiniMax заявил, что его новая модель ИИ превзошла DeepSeek в области рассуждений
Китайский стартап MiniMax представил новую крупную языковую модель, присоединившись к ряду местных компаний, стремящихся превзойти DeepSeek в области ИИ-рассуждений.
Шанхайская компания заявила о высокой эффективности своей новой модели MiniMax-M1 в решении сложных производственных задач, утверждая, что она превосходит всех закрытых китайских конкурентов. В нескольких тестах, представленных MiniMax, модель M1 также показала более высокие результаты, чем последняя версия DeepSeek R1-0528.
M1 поддерживает контекст длиной в миллион токенов — в восемь раз больше, чем у DeepSeek R1. Длина контекста помогает ИИ-системам обрабатывать больше информации одновременно. В некоторых случаях модель MiniMax требует всего около 30% ресурсов по сравнению с DeepSeek, заявила компания. Независимого подтверждения этих заявлений пока нет.
Для обучения M1 компания использовала масштабное обучение с подкреплением, задействовав 512 графических процессоров Nvidia H800. Аренда этих GPU обошлась в $534 700 (~44,3 млн рублей), согласно заявлению.
MiniMax, поддерживаемый крупнейшими китайскими интернет-компаниями Tencent и Alibaba, входит в элитную группу из шести местных ИИ-стартапов, известных как «Маленькие драконы». За последний год они привлекли миллиарды долларов венчурного финансирования, однако рост DeepSeek вынудил большинство участников группы сократить или прекратить фундаментальные исследования, сосредоточившись на прикладных решениях.
MiniMax пообещала поделиться дополнительными обновлениями в ближайшие дни. Среди других продуктов компании — инструмент для генерации видео и приложение-ИИ-компаньон.
0 комментариев