На вторичном рынке Китая появились «улучшенные» графические процессоры Nvidia A100 с большим количеством ядер и видеопамяти

Ampere A100 от Nvidia

NVIDIA Corporation (NASDAQ: NVDA) — американская компания, один из крупнейших разработчиков графических ускорителей и процессоров, а также наборов системной логики. На рынке продукция компании известна под такими торговыми марками как GeForce, nForce, Quadro, Tesla, ION и Tegra. Компания была основана в 1993 году. По состоянию на август 2006 года в корпорации насчитывалось более 8 тысяч сотрудников, работающих в 40 офисах по всему миру. Википедия

Читайте также:Драйверы Nvidia Game Ready поддерживают Manor Lords и DLSS 2Энтузиаст оснастил NAS-накопитель мощным графическим процессором для ChatGPTОпционы на акции «зелёного золота» приносят сотрудникам Nvidia как состояния, так и неудачиДжим Келлер: Nvidia стоило использовать Ethernet в BlackwellNanotronics обещает модульные фабрики по производству чипов на базе искусственного интеллекта

ранее был одним из лучших ускорителей искусственного интеллекта, прежде чем его свергнул новый Hopper H100, не говоря уже о H200 и грядущем Blackwell GB200. Похоже, что производитель чипов, экспериментировал с улучшенной версией, которая так и не появилась на рынке, или, возможно, компании тайно модифицировали A100, чтобы сделать его еще быстрее после санкций США, направленных против Китая. Пользователь X Цзяченг Лю недавно обнаружил на китайском рынке различные прототипы A100, которые демонстрируют значительно более высокие характеристики, чем «обычный» A100 от Nvidia.

Несмотря на усовершенствованные характеристики, A100 7936SP (неофициальное название, основанное на наличии в нем 7936 шейдерных процессоров) использует тот же кристалл GA100 Ampere, что и обычный A100. Однако первый имеет 124 включенных SM (потоковых мультипроцессора) из 128 возможных на чипе GA100. Хотя это и не максимальная конфигурация, A100 7936SP имеет на 15% больше ядер CUDA, чем стандартный A100, что означает значительный прирост производительности.

Количество тензорных ядер также пропорционально количеству SM. Таким образом, наличие большего количества включенных SM означает, что A100 7936SP также имеет больше тензорных ядер. Если судить только по спецификациям, увеличение количества ядер SM, CUDA и Tensor на 15% может аналогичным образом повысить производительность ИИ на 15%.

Nvidia предлагает A100 в конфигурациях 40 ГБ и 80 ГБ. A100 7936SP также выпускается в двух вариантах. Модель A100 7936SP 40 ГБ имеет на 59% более высокую базовую тактовую частоту, чем A100 80 ГБ, сохраняя при этом ту же тактовую частоту в режиме Boost 1410 МГц. С другой стороны, A100 7936SP 96 ГБ демонстрирует базовую тактовую частоту на 18% выше, чем у обычного A100, а также позволяет шестому стеку HBM2 получить до 96 ГБ общей памяти.

Технические характеристики NVIDIA A100 7936SP

Подсистема памяти A100 7936SP 40 ГБ идентична A100 40 ГБ. 40 ГБ памяти HBM2 работают со скоростью 2,4 Гбит/с через 5120-битный интерфейс памяти с использованием пяти стеков HBM2. Такая конструкция обеспечивает максимальную пропускную способность памяти до 1,56 ТБ/с. Однако в центре внимания здесь находится модель A100 7936SP 96 ГБ. Видеокарта имеет на 20% больше памяти HBM2, чем предлагает Nvidia, благодаря шестому включенному стеку HBM2. Обучение очень больших языковых моделей может потребовать большого объема памяти, поэтому дополнительные возможности, безусловно, пригодятся для работы с искусственным интеллектом.

Похоже, что A100 7936SP 96 ГБ имеет обновленную подсистему памяти по сравнению с A100 80 ГБ — память HBM2 работает со скоростью 2,8 Гбит/с вместо 3 Гбит/с, но располагается на более широкой 6144-битной шине памяти, что помогает компенсировать разницу. В результате пропускная способность памяти A100 7936SP 96 ГБ примерно на 11% выше, чем у A100 80 ГБ.

A100 40 ГБ и 80 ГБ имеют TDP 250 Вт и 300 Вт соответственно. Учитывая более быстрые характеристики, A100 7936SP может иметь более высокий TDP. Однако это значение недоступно на общих снимках экрана GPU-Z. Инженерная плата имеет три 8-контактных разъема питания PCIe

Thumbnail: PCI ExpressPCI Express (Peripheral Component Interconnect Express), или PCIe, или PCI-e (также известная как 3GIO for 3rd Generation I/O; не путать с PCI-X и PXI) — компьютерная шина (хотя на физическом уровне шиной не является, будучи соединением типа «точка-точка»), использующая программную модель шины PCI и высокопроизводительный физический протокол, основанный на последовательной передаче данных. Разработка стандарта PCI Express была начата фирмой Intel после отказа от шины InfiniBand. Официально первая базовая спецификация PCI Express появилась в июле 2002 года. Развитием стандарта PCI Express занимается организация PCI Special Interest Group. Википедия

Читайте также:Полный проект спецификации PCIe Gen 7 уже доступен — полноценный выпуск ожидается в 2025 годуРаботающее подключение PCIe 6.0 продемонстрировано Astera LabsКитайский SSD-контроллер RISC-V PCIe 5.0 обещает скорость до 14,2 ГБ/с без вентилятораСамый быстрый графический ускоритель ИИ Nvidia H100 SXM можно установить в обычный слот x16 PCIePCIe 7.0 увеличит пропускную способность в четыре раза по сравнению с PCIe 5.0

вместо одного 8-контактного разъема питания PCIe у Vanilla A100. Будучи инженерным прототипом, A100 7936SP может не использовать все три разъема питания, но он должен потреблять несколько больше энергии, чем стандартный A100, благодаря дополнительным ядрам CUDA и памяти HBM2.

Многие китайские продавцы продают A100 7936SP на eBay. Модель на 96 ГБ стоит от 18 000 до 19 800 долларов. Неизвестно, являются ли ускорители техническими образцами, вышедшими из лаборатории Nvidia, или это индивидуальные модели, разработанные производителем чипов для конкретного клиента.

Конечно, нет никакой гарантии или официальной поддержки драйверов.

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

Указан неверный диаметр вентиляторов, не 80 мм, а 100 мм. И чип не 103, а 102.
  • Анон
С прошлым обновлением как раз и появилась эта ошибка. А новое как и написано не дают скачать.
  • Анон
При включении 3D Turbo Mode у вас максимум будет доступно 8 ядер и 8 потоков всего. т.е. если у вас 16 ядерный на 32 потока то будет всего 8 ядер и 8 потоков! Странная оптимизация!
  • Анон
После скачивания вышел синий экран СУПЕР!
  • Анон
требуется указать магазин и purchase date без этого не регистрирует
  • Анон
Россия на них клала❤❤❤❤, будет называться Ладушка 2.0 )))
  • Анон
ДА у меня тоже неработает уже все Вы не знаете каким способом вернуть все обратно СПАСИ
  • Анон
Хаетв Рустам Базарвич Хаетв
  • Анон
Очень довольна приложением. Пользуюсь сама и рекомендую другим.
16 способ - Ноутбук HP ProBook 4740s автоматически установлена камера HP HD Webcam [Fixed] при этом онлайн из браузера подключается камера к веб страницам, камера работает. С приложениями камера...
  • Анон

Смотреть все