AMD представляет свою первую модель малого языка AMD-135M

/ ТехнологииНовости / Технологии

По мере того как AMD

Advanced Micro Devices, Inc. (AMD, дословный перевод с англ. — «передовые микроустройства») — производитель интегральной микросхемной электроники. Второй по объему производства и продаж производитель процессоров архитектуры x86 c долей рынка 16,9 %▲(2014), а также один из крупнейших производителей графических процессоров (после приобретения ATI Technologies в 2006 году), чипсетов для материнских плат и флеш-памяти. Компания с 2009 года не имеет собственного производства и размещает заказы на мощностях других компаний. Википедия

Читайте также:ASRock официально представляет материнские платы на чипсетах AMD X870E и X870Оверклокер из MSI подтверждает, что модули CUDIMM работают с процессорами AMD Ryzen 8000 и 9000Ошибка материнской платы AMD X670E снижает скорость SSD PCIe 5.0 до PCIe 1.0AMD Ryzen 9 9950X3D и 9900X3D будут оснащены 3D V-cache на обоих чипсетах CCDКитайский процессор Zhaoxin KX-7000 не может превзойти старые чипы Intel и AMD

наращивает свои возможности в сфере искусственного интеллекта, она не только представляет новое оборудование, но и делает ставку на программное обеспечение, пытаясь охватить новые сегменты рынка, на которых Nvidia еще не доминирует.

Таким образом, AMD представила свою первую модель малого языка AMD-135M, которая относится к семейству Llama и нацелена на частные бизнес-развертывания. Неясно, имеет ли новая модель какое-либо отношение к недавнему приобретению компанией Silo AI (поскольку сделка должна быть завершена и одобрена различными органами, так что, вероятно, нет), но это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD, — с использованием оборудования AMD для вывода.

Основная причина, по которой модели AMD быстры, заключается в том, что они используют так называемое спекулятивное декодирование. Спекулятивное декодирование представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в большую, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, этот подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это происходит за счет мощности из-за увеличения транзакций данных.

Новый релиз AMD представлен в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code, каждая из которых разработана для оптимизации определенных задач путем ускорения производительности вывода с помощью технологии спекулятивного декодирования, что является логичным решением для службы ИИ на основе моделей на небольшом языке. Каким-то образом обе версии преобладают в тестах производительности, проводимых AMD.

  • Базовая модель AMD-Llama-135M была обучена с нуля на 670 миллиардах токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов AMD Instinct MI250 (в номенклатуре AMD это просто «четыре узла AMD MI250»).
  • Кроме того, код AMD-Llama-135M был доработан с использованием дополнительных 20 миллиардов токенов, специально предназначенных для кодирования, что позволило выполнить эту задачу за четыре дня с использованием того же оборудования.

AMD считает, что дальнейшие оптимизации могут привести к еще лучшей производительности. Тем не менее, поскольку компания делится результатами тестов своих графических процессоров предыдущего поколения, мы можем только догадываться, на что способны ее нынешнее поколение (MI300X) и следующее поколение (MI325X).

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

Можно делать смартфоны и планшеты на этом процессоре и наконец то использовать полноценную windows. Это отличная замена процессорам arm
  • Анон
Странно почему не 50 долларов.
  • Анон
Понимаю мощь производительность и все дела, но как черт возьми тепло отделять от камня если его прям нагрузить
  • Анон
Не предвзятость это - "Интересно, что Arc B580 проигрывает RTX 4060 в OpenCL" - где разница на невероятных 3,5 %, "но реабилитируется с НЕЗНАЧИТЕЛЬНЫМ 6%-ным преимуществом в Vulkan.". Не...
  • Анон
"Физика вышла из чата"??? Каким образом они добилис свечения точек, которые меньше четверти длины волны???
  • Анон
И теперь нельзя отключить авто обновление!!! Это жесть
  • Анон
Не знаю, я купил Cougar850 80Gold за 10К₽ и нормально
  • Анон
После всех роликов я одно понял у этой игры которую выпустят 20 мая у неё большое будущее
  • Анон
Когда они в продаже появятся? Уже как бы конец февраля, а нигде нет..
  • Анон

Смотреть все