Cerebras: ИИ пишет код в 75 раз быстрее, чем самое быстрое облако GPU

Cerebras

Cerebras Systems — американская компания, занимающаяся искусственным интеллектом, с офисами в Кремниевой долине, Сан-Диего, Торонто и Токио. Cerebras создает компьютерные системы для сложных приложений искусственного интеллекта, требующих глубокого обучения. Википедия

Читайте также:Руководители OpenAI размышляли о приобретении Cerebras в 2017 годуВозможная передача технологий ИИ в Китай: Cerebras откладывает IPO?Cerebras подает заявку на IPO, демонстрирует быстрый рост доходов и снижение убытковНовый процессор Cerebras обладает производительностью 125 петафлопс и имеет 900 000 ядер

добился того, что большая языковая модель Llama 3.1 405B от Meta работала со скоростью 969 токенов в секунду, что в 75 раз быстрее, чем мог обеспечить самый быстрый ИИ-сервис Amazon Web Services с графическими процессорами.
LLM был запущен на облачном сервисе искусственного интеллекта Cerebras Inference, который использует чипы третьего поколения Wafer Scale Engines компании, а не графические процессоры

Thumbnail: Графический процессорГрафический процессор (англ. graphics processing unit, GPU) — отдельное устройство персонального компьютера или игровой приставки, выполняющее графический рендеринг; в начале 2000-х годов графические процессоры стали массово применяться и в других устройствах: планшетные компьютеры, встраиваемые системы, цифровые телевизоры. Современные графические процессоры очень эффективно обрабатывают и отображают компьютерную графику, благодаря специализированной конвейерной архитектуре они намного эффективнее в обработке графической информации, чем типичный центральный процессор. Графический процессор в современных видеокартах (видеоадаптерах) применяется в качестве ускорителя трёхмерной графики. Википедия

от Nvidia

NVIDIA Corporation (NASDAQ: NVDA) — американская компания, один из крупнейших разработчиков графических ускорителей и процессоров, а также наборов системной логики. На рынке продукция компании известна под такими торговыми марками как GeForce, nForce, Quadro, Tesla, ION и Tegra. Компания была основана в 1993 году. По состоянию на август 2006 года в корпорации насчитывалось более 8 тысяч сотрудников, работающих в 40 офисах по всему миру. Википедия

Читайте также:Nvidia представляет новый объединенный процессор CPU и GPU AINvidia создает новый канал в социальных сетях для демонстрации приложений ИИ для ПК на базе RTXDell выпускает первые серверные стойки корпоративного класса Nvidia Blackwell PowerEdge XE9712Перегрев процессоров Blackwell в ЦОДДах Nvidia вызывает задержкиCorsair ожидает, что серия RTX 50 от Nvidia сохранит разъем питания 12 В-2x6

или AMD

Advanced Micro Devices, Inc. (AMD, дословный перевод с англ. — «передовые микроустройства») — производитель интегральной микросхемной электроники. Второй по объему производства и продаж производитель процессоров архитектуры x86 c долей рынка 16,9 %▲(2014), а также один из крупнейших производителей графических процессоров (после приобретения ATI Technologies в 2006 году), чипсетов для материнских плат и флеш-памяти. Компания с 2009 года не имеет собственного производства и размещает заказы на мощностях других компаний. Википедия

Читайте также:Новые слухи о PS6. Sony будет использовать инновационную архитектуру AMDAMD разрабатывает процессор EPYC для Microsoft AzureОдноплатный компьютер AMD Phoenix размером с ладонь по цене до 329 долларовПроблемы с AMD Ryzen 7 9800X3D: производитель проводит проверкуIntel планирует скопировать технологию 3D V-cache от AMD в 2025 году, но не для настольных компьютеров

. Cerebras всегда заявлял, что его сервис Inference является самым быстрым для генерации токенов, отдельных частей, составляющих ответ от LLM. Когда он был впервые запущен в августе, было заявлено, что Cerebras Inference примерно в 20 раз быстрее, чем графические процессоры Nvidia, работающие через облачных провайдеров, таких как Amazon Web Services в Llama 3.1 8B и Llama 3.1 70B.

Но с июля Meta предложила Llama 3.1 405B, которая имеет 405 миллиардов параметров, что делает ее гораздо более тяжелой моделью, чем Llama 3.1 70B с 70 миллиардами параметров. Cerebras утверждает, что ее процессоры Wafer Scale Engine могут запускать этот огромный LLM на «мгновенной скорости» со скоростью токенов 969 в секунду и временем до первого токена всего 0,24 секунды; по данным компании, это мировой рекорд не только для ее чипов, но и для модели Llama 3.1 405B.

По сравнению с графическими процессорами Nvidia, арендованными у AWS, Cerebras Inference был, по-видимому, в 75 раз быстрее; чипы Wafer Scale Engine были в 12 раз быстрее, чем даже самая быстрая реализация графических процессоров Nvidia от Together AI. Его ближайший конкурент, разработчик процессоров ИИ

Thumbnail: Искусственный интеллектИску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами. Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия

Читайте также:Nvidia создает новый канал в социальных сетях для демонстрации приложений ИИ для ПК на базе RTXRiot Games набирает сотрудников после массовых увольнений. В том числе для исследований ИИ в играхAMD увольняет 4 процента своих сотрудников по всему миру, сосредоточившись на ИИLG и Tenstorrent расширяют партнерство для улучшения возможностей чипов ИИСША приказали TSMC прекратить поставки передовых процессоров ИИ в Китай: отчет

SambaNova, был побит Cerebras Inference в 6 раз.

Чтобы проиллюстрировать, насколько это быстро, Cerebras поручил Fireworks (самый быстрый облачный сервис ИИ, оснащенный графическими процессорами) и Inference создать шахматную программу на Python. Cerebras Inference занял около трех секунд, а Fireworks — 20.

«Llama 3.1 405B на Cerebras — это, безусловно, самая быстрая модель frontier в мире — в 12 раз быстрее, чем GPT-4o, и в 18 раз быстрее, чем Claude 3.5 Sonnet», — заявили в Cerebras. «Благодаря сочетанию открытого подхода Meta и революционной технологии вывода Cerebras, Llama 3.1-405B теперь работает более чем в 10 раз быстрее закрытых моделей frontier».

Даже при увеличении размера запроса с 1000 токенов до 100 000 токенов (подсказка, состоящая как минимум из пары тысяч слов), Cerebras Inference, по-видимому, работал со скоростью 539 токенов в секунду. Из пяти других сервисов, которые могли справиться с этой рабочей нагрузкой, лучший набрал всего 49 токенов в секунду.

Cerebras также похвасталась, что всего лишь один Wafer Scale Engine второго поколения превзошел суперкомпьютер Frontier в 768 раз в моделировании молекулярной динамики. Frontier был самым быстрым суперкомпьютером в мире до понедельника, когда был запущен суперкомпьютер El Capitan, и он имеет 9472 процессора Epyc от AMD.

Кроме того, чип Cerebras превзошел суперкомпьютер Anton 3 на 20%, что является значительным достижением, учитывая, что Anton 3 был создан для молекулярной динамики; его производительность в 1,1 миллиона шагов моделирования в секунду также стала первым случаем, когда компьютер преодолел барьер в миллион шагов моделирования.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

Указан неверный диаметр вентиляторов, не 80 мм, а 100 мм. И чип не 103, а 102.
  • Анон
С прошлым обновлением как раз и появилась эта ошибка. А новое как и написано не дают скачать.
  • Анон
При включении 3D Turbo Mode у вас максимум будет доступно 8 ядер и 8 потоков всего. т.е. если у вас 16 ядерный на 32 потока то будет всего 8 ядер и 8 потоков! Странная оптимизация!
  • Анон
После скачивания вышел синий экран СУПЕР!
  • Анон
требуется указать магазин и purchase date без этого не регистрирует
  • Анон
Россия на них клала❤❤❤❤, будет называться Ладушка 2.0 )))
  • Анон
ДА у меня тоже неработает уже все Вы не знаете каким способом вернуть все обратно СПАСИ
  • Анон
Хаетв Рустам Базарвич Хаетв
  • Анон
Очень довольна приложением. Пользуюсь сама и рекомендую другим.
16 способ - Ноутбук HP ProBook 4740s автоматически установлена камера HP HD Webcam [Fixed] при этом онлайн из браузера подключается камера к веб страницам, камера работает. С приложениями камера...
  • Анон

Смотреть все