Китайская компания Moore Threads выпустила Torch-MUSA v2.0.0 с поддержкой FP8 для ускорения ИИ-вычислений

Kuai Technology («快科技») сообщает о выходе Torch-MUSA v2.0.0 — важного обновления библиотеки для работы с фреймворком PyTorch на GPU от Moore Threads. Новая версия полностью открыта и доступна на GitHub.

Ключевая особенность Torch-MUSA v2.0.0 — полная поддержка формата FP8, что позволяет ускорить обучение больших языковых моделей и снизить нагрузку на видеопамять. Это стало возможным благодаря архитектуре MUSA Compute Capability 3.1.

Основные улучшения в версии 2.0.0:

  • Виртуальное управление памятью — уменьшает фрагментацию и нагрузку на GPU при обучении моделей.
  • MUSA Graph — объединяет ядра для снижения нагрузки на CPU.
  • Поддержка Triton в torch.compile — повышает производительность через стандартные интерфейсы PyTorch.

Библиотека также получила совместимость с PyTorch 2.5.0, а в будущем планируется поддержка более новых версий фреймворка.


ИИ: Развитие китайских GPU-решений, таких как Moore Threads, показывает растущую конкуренцию на рынке ускорителей для ИИ. Поддержка FP8 и оптимизация под PyTorch делают эти решения привлекательными для разработчиков, особенно в условиях ограниченного доступа к западным технологиям.
Подписаться на обновления Новости / Технологии

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• Rutab-Бот читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос и обновите страницу через пару минут 👍
• Rutab-Бот работает в тестовом режиме и может ошибаться, либо просто не знать ответа.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Новые комментарии

а разве рыцари Круглого стола и викинги не были чернокожими???
  • Анон
игра с формированием ложного самомнения через подхалимаж. ---По образу и подобию .....
  • Анон
Если игра упирается в производительность видеокарты, то хоть заускоряй процессор, а FPS больше не будет. Я у себя на синтетических тестах получил лишь меньшую задержку памяти. В играх практически...
  • Анон
Всё в порядке с физикой: источник может быть меньше четверти длины волны. Даже одиночный ион в ионной ловушке может излучать видимый свет (а размер меньше 0.2нм).
  • Анон
Можно делать смартфоны и планшеты на этом процессоре и наконец то использовать полноценную windows. Это отличная замена процессорам arm
  • Анон
Странно почему не 50 долларов.
  • Анон
Понимаю мощь производительность и все дела, но как черт возьми тепло отделять от камня если его прям нагрузить
  • Анон
Не предвзятость это - "Интересно, что Arc B580 проигрывает RTX 4060 в OpenCL" - где разница на невероятных 3,5 %, "но реабилитируется с НЕЗНАЧИТЕЛЬНЫМ 6%-ным преимуществом в Vulkan.". Не...
  • Анон
И теперь нельзя отключить авто обновление!!! Это жесть
  • Анон
Не знаю, я купил Cougar850 80Gold за 10К₽ и нормально
  • Анон

Смотреть все