Срок службы графического процессора в центре обработки данных может быть на удивление коротким

По словам высокопоставленного специалиста Alphabet, которого цитирует Tech Fund, графические процессоры

Thumbnail: Графический процессорГрафический процессор (англ. graphics processing unit, GPU) — отдельное устройство персонального компьютера или игровой приставки, выполняющее графический рендеринг; в начале 2000-х годов графические процессоры стали массово применяться и в других устройствах: планшетные компьютеры, встраиваемые системы, цифровые телевизоры. Современные графические процессоры очень эффективно обрабатывают и отображают компьютерную графику, благодаря специализированной конвейерной архитектуре они намного эффективнее в обработке графической информации, чем типичный центральный процессор. Графический процессор в современных видеокартах (видеоадаптерах) применяется в качестве ускорителя трёхмерной графики. Википедия

для центров обработки данных могут прослужить всего от одного до трех лет в зависимости от интенсивности их использования. Поскольку графические процессоры выполняют всю тяжелую работу по обучению и выводу ИИ

Thumbnail: Искусственный интеллектИску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами. Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия

Читайте также:Дженсен Хуанг признал ошибку Nvidia в чипах ИИSSSTC представляет Gen5 Enterprise SSDТайвань рассматривает новые планы в области ядерной энергетики в связи с требованиями бума ИИГенеральный директор Baidu предупреждает, что ИИ — это неизбежный пузырьАнтичит Ricochet в Call of Duty: Black Ops 6 усовершенствуют с помощью ИИ

, они являются компонентами, которые постоянно находятся под значительной нагрузкой, и поэтому они деградируют быстрее, чем другие компоненты.

Коэффициент использования графических процессоров для рабочих нагрузок ИИ в центре обработки данных, управляемом поставщиками облачных услуг (CSP), составляет от 60% до 70%. При таких коэффициентах использования графический процессор обычно работает от одного до двух лет, максимум три года, согласно цитате, якобы сделанной главным архитектором генеративного ИИ из Alphabet и сообщенной @techfund, долгосрочным технологическим инвестором с хорошими источниками.

Мы не смогли проверить имя человека, который называет себя «главным архитектором GenAI в Alphabet», и поэтому мы не можем на 100% доверять его заявлениям. Тем не менее, мы понимаем, что это заявление имеет смысл, поскольку современные графические процессоры дата-центров для приложений ИИ и HPC потребляют и рассеивают 700 Вт мощности или более, что является ощутимой нагрузкой для крошечных кусочков кремния.

По словам докладчика, есть способ продлить срок службы графических процессоров: снизить коэффициент их использования. Однако это означает, что они будут медленнее амортизироваться и медленнее возвращать свой капитал, что не особенно хорошо для бизнеса, в результате большинство поставщиков облачных услуг предпочтут использовать свои графические процессоры с высоким коэффициентом использования.

Ранее в этом году Meta опубликовала исследование, описывающее обучение модели Llama 3 405B на кластере, работающем на 16 384 графических процессорах Nvidia H100 80 ГБ. Коэффициент использования провалов модели (MFU) кластера составил около 38% (при использовании BF16), и все же из 419 непредвиденных сбоев (во время 54-дневного снимка перед обучением) 148 (30,1%) были вызваны различными сбоями графического процессора (включая сбои NVLink), тогда как 72 (17,2%) были вызваны провалами памяти HBM3.

Результаты Meta кажутся весьма благоприятными для графических процессоров H100. Если графические процессоры и их память продолжат выходить из строя с той же скоростью, что и Meta, то годовой показатель отказов этих процессоров составит около 9%, тогда как годовой показатель отказов для этих графических процессоров за три года составит около 27%, хотя вполне вероятно, что графические процессоры будут выходить из строя чаще после года эксплуатации.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

При включении 3D Turbo Mode у вас максимум будет доступно 8 ядер и 8 потоков всего. т.е. если у вас 16 ядерный на 32 потока то будет всего 8 ядер и 8 потоков! Странная оптимизация!
  • Анон
После скачивания вышел синий экран СУПЕР!
  • Анон
требуется указать магазин и purchase date без этого не регистрирует
  • Анон
Россия на них клала❤❤❤❤, будет называться Ладушка 2.0 )))
  • Анон
ДА у меня тоже неработает уже все Вы не знаете каким способом вернуть все обратно СПАСИ
  • Анон
Хаетв Рустам Базарвич Хаетв
  • Анон
Очень довольна приложением. Пользуюсь сама и рекомендую другим.
16 способ - Ноутбук HP ProBook 4740s автоматически установлена камера HP HD Webcam [Fixed] при этом онлайн из браузера подключается камера к веб страницам, камера работает. С приложениями камера...
  • Анон
вообще не редкий, мне с озона такой же пришел
  • Анон
Чу горбатого лепите? в инструкции BypassTPPMCheck на картинке BypassTPMCheck вы хоть проверяйте! этж реестр ё маё!
  • Анон

Смотреть все