Молния: Moore Threads адаптировала флагманский GPU MTT S5000 под новую модель MiniMax M2.5 в день релиза
Сегодня китайская компания Moore Threads сообщила о успешной адаптации своего флагманского универсального GPU MTT S5000 для работы с новой крупной языковой моделью MiniMax M2.5 в день её выхода (Day-0).
Новая модель MiniMax M2.5, как сообщается, демонстрирует выдающиеся возможности в программировании, использовании инструментов и выполнении задач агентами, что предъявляет высокие требования к вычислительной эффективности, особенно при обработке длинного контекста.
GPU MTT S5000, благодаря мощному покрытию операторов и экосистемной совместимости архитектуры MUSA, а также встроенной поддержке ускорения FP8, способен справляться с задачами, которые ставит эта модель.
Это не первый случай для Moore Threads. Компания уже неоднократно обеспечивала мгновенную адаптацию ведущих китайских больших моделей в день их релиза. Например, на днях, когда Zhipu AI представила новую модель GLM-5, Moore Threads также выполнила полную адаптацию и проверку на MTT S5000 в Day-0.
Ранее, объявляя о поддержке GLM-5, Moore Threads впервые раскрыла некоторые параметры и производительность GPU MTT S5000.
Согласно данным, MTT S5000 оснащён видеопамятью объёмом до 80 ГБ с пропускной способностью 1,6 ТБ/с, что на 67% и 113% соответственно больше, чем у предыдущего поколения MTT S4000. Межкарточная пропускная способность в многокарточных конфигурациях достигает 784 ГБ/с.
Карта полностью поддерживает вычисления с полной точностью от FP8 до FP64, оснащена аппаратными ускорительными блоками Tensor Core для FP8. Пиковая производительность в вычислениях ИИ с точностью FP8 на одной карте достигает 1000 TFLOPS, впервые выходя на уровень PFLOPS.







0 комментариев