DeepSeek анонсировала новый формат данных UE8M0 FP8 для будущих китайских AI-чипов
После выпуска DeepSeek v3.1 компания официально анонсировала формат UE8M0 FP8 — следующий шаг в разработке отечественных чипов. Этот формат (8-битная мантисса, 0-битный экспонент) специально оптимизирован для ключевых AI-операций, таких как матричное умножение.
Использование параметров точности UE8M0 FP8 Scale в DeepSeek-V3.1 рассматривается как сигнал о переходе китайских AI-чипов на новый этап развития. Как отмечают эксперты, простое «наращивание количества карт» не полностью удовлетворяет потребности, поэтому повышение эффективности отдельных ускорителей и оптимизация кластерных решений также критически важны.
Анонс DeepSeek открывает новые перспективы для экосистемы китайских вычислений, включая замкнутую адаптацию от чипов и фреймворков до платформ вычислений и прикладного уровня.
Компания Moore Threads (Мур Тредс) подтвердила, что её решения уже нативно поддерживают FP8 и соответствующие функции DeepSeek.
По словам представителей Moore Threads, их платформа поддерживает полный спектр точности от FP64 до INT8 и является одной из немногих в Китае, предлагающих платформы для обучения больших моделей с FP8. Технология смешанной точности FP8 эффективно повышает возможности обучения и вывода, обеспечивая прирост производительности на 20–30% при обучении современных больших моделей.
Кроме того, компания East 芯 (Дунсинь Гуфэнь) на интерактивной платформе сообщила, что LiSuan Technology (Лисуань Кэцзи) занимается разработкой масштабируемых GPU для рендеринга графики. Их продукты обеспечивают основную графическую визуализацию и ускорение AI на устройствах, в облаке и на периферии.
Серия GPU 7G100 поддерживает задачи с одинарной (FP32) и половинной (FP16) точностью, а также 8-битные целочисленные операции (INT8). Различная точность вычислений имеет свои сценарии применения в зависимости от производительности, потребления ресурсов и эффективности.
Прорывы в области отечественных чипов для вычислений в сочетании с развитием экосистемы укрепляют позиции китайских производителей и снижают зависимость от решений вроде NVIDIA H20.
0 комментариев