Дженсен Хуанг признал ошибку Nvidia в чипах ИИ
Читайте также:Графический процессор NVIDIA GeForce RTX 5090 «Blackwell» появляется во время заводской загрузкиLenovo представляет новые серверы с жидкостным охлаждениемGoogle демонстрирует производственную систему NVIDIA «Blackwell» NVL72 для облакаNvidia вносит свой вклад в проект Open Compute Project с разработкой платформы BlackwellNVIDIA участвует в разработке платформы Blackwell
NVIDIA Corporation (NASDAQ: NVDA) — американская компания, один из крупнейших разработчиков графических ускорителей и процессоров, а также наборов системной логики. На рынке продукция компании известна под такими торговыми марками как GeForce, nForce, Quadro, Tesla, ION и Tegra. Компания была основана в 1993 году. По состоянию на август 2006 года в корпорации насчитывалось более 8 тысяч сотрудников, работающих в 40 офисах по всему миру. Википедия
Читайте также:Твердотельные накопители Micron рекомендованы для NVIDIA GB200 NVL72Возможный графический процессор NVIDIA GeForce RTX 5080 для ноутбука на фотоПоследний драйвер графического процессора Nvidia добавляет 32 VRR-дисплея, совместимых с G-SyncNvidia планирует сделать крупные инвестиции в ТаиландеБывший инженер Nvidia обнаружил простое число длиной в 41 миллион цифр
TSMC (аббревиатура от англ. Taiwan Semiconductor Manufacturing Company) — тайваньская компания, занимающаяся изучением и производством полупроводниковых изделий. Основана в 1987 году правительством Китайской республики и частными инвесторами. Штаб-квартира TSMC находится в г. Википедия
Читайте также:Последние процессоры искусственного интеллекта Huawei предположительно были произведены TSMC: отчетСообщается, что TSMC раскрыла заговор Huawei по обходу экспортного контроля СШАIntel и Samsung сформируют «Foundry Alliance» для конкуренции с TSMC, сообщает Notes ReportМощность TSMC CoWoS удвоилась за два года, но все еще недостаточна: TrendForceВ отчете утверждается, что США расследуют деятельность TSMC в связи с секретными сделками с Huawei
«У нас был недостаток в конструкции Blackwell, он был функционален, но недостаток конструкции привел к низкой производительности», — сказал Хуан. «Это была 100% вина Nvidia».
Когда появились первые сообщения о дефекте дизайна, некоторые СМИ предположили, что виновата TSMC, и предположили, что это может вызывать напряженность между Nvidia и ее партнером по литейному производству. По словам Хуанга, это не так, и проблема была вызвана собственными просчетами Nvidia. Хуанг также отверг сообщения о напряженности между двумя компаниями как «фейковые новости».
Графические процессоры Blackwell B100 и B200 от Nvidia соединяют свои два чиплета с помощью технологии упаковки CoWoS-L от TSMC, которая основана на интерпозере RDL, оснащенном локальными мостами кремниевых соединений (LSI) (чтобы обеспечить скорость передачи данных около 10 ТБ/с). Размещение этих мостов имеет решающее значение. Однако предполагаемое несоответствие свойств теплового расширения между чиплетами GPU, мостами LSI, интерпозером RDL и подложкой материнской платы привело к деформации и отказу системы, и, как сообщается, Nvidia пришлось модифицировать верхние металлические слои и выступы кремния GPU для повышения производительности. Хотя компания не раскрыла конкретных подробностей об исправлении, она упомянула, что потребовались новые маски.
Проблемы, убивающие выход годного, и серьезные проблемы с функциональностью (erratas) не являются чем-то необычным в мире полупроводников. Обычно компании устраняют их, модифицируя металлический слой (или два) и называя это новым степпингом. Показательный пример: сообщается, что у Sapphire Rapids от Intel было 500 ошибок, и компания выпустила около дюжины степпингов, чтобы исправить их все. На выполнение каждого нового степпинга уходит около трех месяцев (включая выявление проблемы, ее устранение и выпуск новой версии чипа), поэтому скорость, с которой Nvidia и TSMC исправили графический процессор Blackwell, весьма впечатляет.
Исправленные графические процессоры Blackwell для искусственного интеллекта и суперкомпьютеров поступят в массовое производство в конце октября, а поставки должны начаться в начале следующего года (который по-прежнему будет финансовым годом Nvidia 2025).
Тем не менее, ранее в этом году Nvidia сообщила, что для удовлетворения спроса на свои графические процессоры Blackwell среди крупных поставщиков облачных услуг, таких как AWS, Google и Microsoft, ей все равно придется отгрузить часть первоначальных процессоров Blackwell с низким выходом в 2024 году. Неясно, сколько графических процессоров Blackwell будет отправлено в центры обработки данных в 2024 году.
Источник: Tomshardware.com
0 комментариев