Американский ускоритель Atlas от Positron AI превосходит Nvidia H200 в задачах ИИ, потребляя втрое меньше энергии
На фоне растущих опасений по поводу энергопотребления систем для ИИ-инференса, компания Cloudflare тестирует альтернативные ускорители, не связанные с решениями AMD или Nvidia. Как сообщает The Wall Street Journal, одним из таких решений стал ускоритель Atlas от американского стартапа Positron AI, который по заявлениям разработчика превосходит Nvidia H200, потребляя лишь 33% от его энергозатрат.
Основанная в 2023 году Positron AI специализируется исключительно на создании ускорителей для инференса. В отличие от универсальных GPU, их решение Atlas изначально проектировалось для эффективного выполнения задач ИИ с минимальным энергопотреблением. Система включает восемь специализированных ускорителей Archer и позиционируется как конкурент серверов на базе архитектуры Hopper от Nvidia.
Согласно внутренним тестам Positron AI, Atlas демонстрирует около 280 токенов в секунду на пользователя в модели Llama 3.1 8B при потреблении 2000 Вт. Для сравнения: 8-процессорная система Nvidia DGX H200 в том же сценарии выдает лишь ~180 токенов/с, расходуя при этом 5900 Вт. Это делает Atlas втрое эффективнее как по соотношению «производительность/ватт», так и «производительность/доллар». Однако эти данные требуют независимой проверки.
Изображение: Positron AI
Интересно, что Positron AI производит свои ASIC-чипы на фабрике TSMC в Аризоне (техпроцесс N4/N5), а сборка карт также осуществляется в США. Правда, поскольку чипы используют 32 ГБ памяти HBM, их финальная упаковка, вероятно, происходит на Тайване.
Системы Atlas совместимы с популярными ИИ-инструментами вроде Hugging Face и поддерживают API, аналогичный OpenAI, что упрощает интеграцию без перестройки рабочих процессов.
Стартап уже привлек более $75 млн инвестиций (~6 млрд рублей), включая недавний раунд на $51.6 млн (~4.1 млрд рублей) под руководством Valor Equity Partners. В разработке находится ускоритель второго поколения Asimov (8-чиповая система Titan), который в 2026 году должен конкурировать с решениями на базе платформы Vera Rubin от Nvidia.
Изображение: Positron AI
Asimov получит 2 ТБ памяти на чип (уже не HBM), пропускную способность сети 16 Тбит/с и сможет обрабатывать модели до 16 трлн параметров на одной машине, снимая ограничение «одна модель — один GPU».
Рост энергопотребления ИИ-индустрии вызывает тревогу: некоторые дата-центры для обучения моделей уже потребляют столько же, сколько небольшие города. Cloudflare в числе первых тестирует решения Positron AI, тогда как Google, Meta и Microsoft разрабатывают собственные энергоэффективные ускорители.
Источник: Tomshardware.com
* Meta, Facebook и Instagram запрещены в России.
0 комментариев