NVIDIA может выпустить в Китай полноценный AI-чип Groq без ограничений

Вчера на конференции GTC компания NVIDIA представила несколько новых AI-систем, а также официально анонсировала чип нового класса — Groq 3 LPU. Это результат поглощения технологии Groq за 20 миллиардов долларов в прошлом году.

В отличие от AI GPU, которые в основном ориентированы на обучение больших моделей, чип Groq 3 LPU создан специально для AI-инференции (вывода). Он обладает преимуществами в виде низкой задержки и работы с длинным контекстом. Его можно использовать в паре с GPU Vera Rubin, обеспечивая полный цикл внедрения искусственного интеллекта.

Хорошая новость заключается в том, что этот LPU-чип, возможно, станет доступен и в Китае. Иностранные СМИ со ссылкой на осведомлённые источники сообщают, что NVIDIA готовит к выпуску версию чипа Groq для поставок на китайский рынок.

В отличие от предыдущих графических процессоров, которые подвергались «урезанию» производительности перед экспортом, новый чип Groq не будет иметь ограничений по спецификациям и не станет специальной «китайской» версией, подобной H20.

Отсутствие ограничений и специальных версий, очевидно, снимет многие барьеры для продаж такого чипа в Китае. Однако главный вопрос заключается в том, сможет ли NVIDIA получить одобрение американских регуляторов. Это будет зависеть от того, как глава компании Дженсен Хуанг сможет убедить президента США.

Стоит отметить, что даже если NVIDIA не станет создавать урезанную версию Groq для Китая, нет гарантии, что на местный рынок поступит именно вчера представленный Groq 3 LPU. Его текущие характеристики и производительность очень высоки.

Один такой чип, называемый LPU30, производится компанией Samsung. Он объединяет 500 МБ кэш-памяти SRAM, содержит 98 миллиардов транзисторов и обеспечивает производительность 1.2 PFLOPS в формате FP8. Его AI-производительность значительно уступает GPU Rubin, но пропускная способность памяти в 150 ТБ/с намного выше, чем у HBM4 (22 ТБ/с).

Чипы Groq 3 LPU будут поставляться в виде стоечных систем Groq 3 LPX, которые могут объединять до 256 чипов LPU30. Объём кэш-памяти в такой системе достигает 128 ГБ, а совокупная пропускная способность памяти увеличивается до колоссальных 40 ПБ/с. Пропускная способность межсоединений также впечатляет — 640 ТБ/с.

В целом, по вычислительной мощности для AI LPU не может сравниться с GPU. Однако пропускная способность SRAM, без сомнения, превосходит HBM4, а задержки — ниже. Эти чипы предназначены для разных задач, и один не заменяет другой. Ожидается, что в ближайшее время продажи LPU-систем резко возрастут.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Все комментарии - Технологии