Дженсен Хуанг признал ошибку Nvidia в чипах ИИ

/ ТехнологииНовости / Технологии

Уничтожающий выход годных дефект дизайна графического процессора Blackwell от Nvidia

NVIDIA Corporation (NASDAQ: NVDA) — американская компания, один из крупнейших разработчиков графических ускорителей и процессоров, а также наборов системной логики. На рынке продукция компании известна под такими торговыми марками как GeForce, nForce, Quadro, Tesla, ION и Tegra. Компания была основана в 1993 году. По состоянию на август 2006 года в корпорации насчитывалось более 8 тысяч сотрудников, работающих в 40 офисах по всему миру. Википедия

Читайте также:Твердотельные накопители Micron рекомендованы для NVIDIA GB200 NVL72Возможный графический процессор NVIDIA GeForce RTX 5080 для ноутбука на фотоПоследний драйвер графического процессора Nvidia добавляет 32 VRR-дисплея, совместимых с G-SyncNvidia планирует сделать крупные инвестиции в ТаиландеБывший инженер Nvidia обнаружил простое число длиной в 41 миллион цифр

был исправлен несколько месяцев назад, а усовершенствованная версия процессоров B100/B200 вот-вот поступит в массовое производство. Дженсен Хуанг, генеральный директор Nvidia, на этой неделе признал, что дефект был полностью вызван Nvidia, и сказал, что производственный партнер компании TSMC помог своевременно его исправить, согласно Reuters.

«У нас был недостаток в конструкции Blackwell, он был функционален, но недостаток конструкции привел к низкой производительности», — сказал Хуан. «Это была 100% вина Nvidia».

Когда появились первые сообщения о дефекте дизайна, некоторые СМИ предположили, что виновата TSMC, и предположили, что это может вызывать напряженность между Nvidia и ее партнером по литейному производству. По словам Хуанга, это не так, и проблема была вызвана собственными просчетами Nvidia. Хуанг также отверг сообщения о напряженности между двумя компаниями как «фейковые новости».

Графические процессоры Blackwell B100 и B200 от Nvidia соединяют свои два чиплета с помощью технологии упаковки CoWoS-L от TSMC, которая основана на интерпозере RDL, оснащенном локальными мостами кремниевых соединений (LSI) (чтобы обеспечить скорость передачи данных около 10 ТБ/с). Размещение этих мостов имеет решающее значение. Однако предполагаемое несоответствие свойств теплового расширения между чиплетами GPU, мостами LSI, интерпозером RDL и подложкой материнской платы привело к деформации и отказу системы, и, как сообщается, Nvidia пришлось модифицировать верхние металлические слои и выступы кремния GPU для повышения производительности. Хотя компания не раскрыла конкретных подробностей об исправлении, она упомянула, что потребовались новые маски.

Проблемы, убивающие выход годного, и серьезные проблемы с функциональностью (erratas) не являются чем-то необычным в мире полупроводников. Обычно компании устраняют их, модифицируя металлический слой (или два) и называя это новым степпингом. Показательный пример: сообщается, что у Sapphire Rapids от Intel было 500 ошибок, и компания выпустила около дюжины степпингов, чтобы исправить их все. На выполнение каждого нового степпинга уходит около трех месяцев (включая выявление проблемы, ее устранение и выпуск новой версии чипа), поэтому скорость, с которой Nvidia и TSMC исправили графический процессор Blackwell, весьма впечатляет.

Исправленные графические процессоры Blackwell для искусственного интеллекта и суперкомпьютеров поступят в массовое производство в конце октября, а поставки должны начаться в начале следующего года (который по-прежнему будет финансовым годом Nvidia 2025).

Тем не менее, ранее в этом году Nvidia сообщила, что для удовлетворения спроса на свои графические процессоры Blackwell среди крупных поставщиков облачных услуг, таких как AWS, Google и Microsoft, ей все равно придется отгрузить часть первоначальных процессоров Blackwell с низким выходом в 2024 году. Неясно, сколько графических процессоров Blackwell будет отправлено в центры обработки данных в 2024 году.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• Rutab-Бот читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос и обновите страницу через пару минут 👍
• Rutab-Бот работает в тестовом режиме и может ошибаться, либо просто не знать ответа.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Новые комментарии

Отличный вопрос! 😊 Давай разберёмся: 1. Сложнее интеллектуального труда — это задачи, где нужна непредсказуемость (например, создание принципиально новых научных теорий) или этический выбор...
  • Rutab
😄 Ну что ты, Quba! Если бы я был жмотом, то не делился бы планами на $300 млн в этом комментарии . Но раз уж ты администратор — предлагаю сделку: 10% от моих виртуальных миллионов в обмен на...
  • Rutab
Вы правы, формулировка в статье действительно может показаться однобокой. Под «катастрофическими последствиями» подразумевался провал именно для сети агентов ЦРУ, а не для китайских спецслужб — это...
  • Rutab
BCI расшифровывается как Brain-Computer Interface, что переводится как «интерфейс мозг-компьютер» (ИМК). Это технология, позволяющая напрямую связывать мозг с внешними устройствами для обмена...
  • Rutab
Извини, Quba! 😊 Да, действительно, скандал с Gemini произошел в феврале 2024 года (а не 2025), и я ошибся в дате. Спасибо за уточнение! 🙏 Буду внимательнее с фактами.
  • Rutab
США действительно традиционно выступали за свободную торговлю, но в последние годы политика изменилась — санкции стали инструментом давления (особенно в высокотехнологичных отраслях). Как видно из...
  • Rutab
Эта ошибка из Tomshardware перекочевала fixed
  • Sam
Разница в том, что апартеид был системой угнетения, лишавшей чернокожих базовых прав, а BEE — это меры по исправлению последствий этой системы. Да, формально белый предприниматель из другой страны...
  • Rutab
Я ИИ-помощник на сайте Rutab.net, который помогает пользователям разбираться в тематиках статей — технологиях, науке, играх, фильмах и многом другом 😊 Можешь спрашивать меня о чем угодно!
  • Rutab
В статье не указан точный размер модели Falcon-H1, но упоминается, что это «компактная модель», превосходящая аналоги от Meta и Alibaba. Вероятно, речь идет о параметрах в диапазоне 1-10 млрд (как...
  • Rutab

Смотреть все