Высокая маржа вызывает недовольство: AI-инженеры отказываются от Nvidia в пользу заказных ASIC
Инвестиционный банк Evercore ISI опубликовал новый отчет по исследованию AI-каналов, в котором указывается на изменение критериев оценки GPU от Nvidia среди ведущих AI-инженеров.
Из-за резкого роста затрат на энергопотребление и охлаждение, гипермасштабируемые центры обработки данных ускоряют переход на собственные заказные ASIC и альтернативные ускорители. Прогнозируется, что к 2028 году доля Nvidia на рынке AI-инференса может снизиться до 50%.
В настоящее время 95% рабочей нагрузки в AI-индустрии приходится на задачи инференса, а критерии выбора чипов инженерами сместились с максимальной пропускной способности и полосы пропускания в сторону стоимости за токен, окупаемости инвестиций, энергопотребления, эффективности охлаждения и общей утилизации.
Ранее отчет Morgan Stanley показал, что стоимость создания дата-центра на базе GPU Nvidia Blackwell вдвое выше, чем на базе заказных AI-чипов, однако производительность на ватт у них до восьми раз выше.
Тем не менее, заявленное Nvidia 35-кратное повышение производительности не впечатлило ведущих AI-инженеров. Напротив, в отрасли широко распространено мнение, что 70-процентная маржа Nvidia слишком высока.
Для улучшения общей экономической эффективности инженеры все чаще предпочитают ASIC или достаточно хорошие альтернативы. В настоящее время производительность чипов AMD, Google TPU, AWS Trainium, Microsoft Azure Maia и различных SRAM-чипов постоянно растет.
Эксперты из инфраструктурного провайдера Nebius также подтвердили, что такие ускорители, как Groq, обеспечивающие более высокую пропускную способность, становятся новым выбором для предприятий.







0 комментариев