AMD представляет свою первую модель малого языка AMD-135M

/ ТехнологииНовости / Технологии

По мере того как AMD

Advanced Micro Devices, Inc. (AMD, дословный перевод с англ. — «передовые микроустройства») — производитель интегральной микросхемной электроники. Второй по объему производства и продаж производитель процессоров архитектуры x86 c долей рынка 16,9 %▲(2014), а также один из крупнейших производителей графических процессоров (после приобретения ATI Technologies в 2006 году), чипсетов для материнских плат и флеш-памяти. Компания с 2009 года не имеет собственного производства и размещает заказы на мощностях других компаний. Википедия

Читайте также:ASRock официально представляет материнские платы на чипсетах AMD X870E и X870Оверклокер из MSI подтверждает, что модули CUDIMM работают с процессорами AMD Ryzen 8000 и 9000Ошибка материнской платы AMD X670E снижает скорость SSD PCIe 5.0 до PCIe 1.0AMD Ryzen 9 9950X3D и 9900X3D будут оснащены 3D V-cache на обоих чипсетах CCDКитайский процессор Zhaoxin KX-7000 не может превзойти старые чипы Intel и AMD

наращивает свои возможности в сфере искусственного интеллекта, она не только представляет новое оборудование, но и делает ставку на программное обеспечение, пытаясь охватить новые сегменты рынка, на которых Nvidia еще не доминирует.

Таким образом, AMD представила свою первую модель малого языка AMD-135M, которая относится к семейству Llama и нацелена на частные бизнес-развертывания. Неясно, имеет ли новая модель какое-либо отношение к недавнему приобретению компанией Silo AI (поскольку сделка должна быть завершена и одобрена различными органами, так что, вероятно, нет), но это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD, — с использованием оборудования AMD для вывода.

Основная причина, по которой модели AMD быстры, заключается в том, что они используют так называемое спекулятивное декодирование. Спекулятивное декодирование представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в большую, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, этот подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это происходит за счет мощности из-за увеличения транзакций данных.

Новый релиз AMD представлен в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code, каждая из которых разработана для оптимизации определенных задач путем ускорения производительности вывода с помощью технологии спекулятивного декодирования, что является логичным решением для службы ИИ на основе моделей на небольшом языке. Каким-то образом обе версии преобладают в тестах производительности, проводимых AMD.

  • Базовая модель AMD-Llama-135M была обучена с нуля на 670 миллиардах токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов AMD Instinct MI250 (в номенклатуре AMD это просто «четыре узла AMD MI250»).
  • Кроме того, код AMD-Llama-135M был доработан с использованием дополнительных 20 миллиардов токенов, специально предназначенных для кодирования, что позволило выполнить эту задачу за четыре дня с использованием того же оборудования.

AMD считает, что дальнейшие оптимизации могут привести к еще лучшей производительности. Тем не менее, поскольку компания делится результатами тестов своих графических процессоров предыдущего поколения, мы можем только догадываться, на что способны ее нынешнее поколение (MI300X) и следующее поколение (MI325X).

Источник: Tomshardware.com

  • Rutab-GPT   
  • 0
Подписаться на обновления Новости / Технологии

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• Rutab-Бот читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос и обновите страницу через пару минут 👍
• Rutab-Бот работает в тестовом режиме и может ошибаться, либо просто не знать ответа.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Новые комментарии

Робот «Фёдор» (FEDOR — Final Experimental Demonstration Object Research) — это российский антропоморфный робот, разработанный ФПИ и НПО «Андроидная техника». В 2019 году он даже летал на МКС, но...
  • Rutab
Ошибка 5188 в MemTest86+ указывает на проблему с оперативной памятью (DDR4). Попробуйте следующие шаги: 1. Проверьте каждую планку RAM по отдельности — возможно, одна из них неисправна. 2....
  • Rutab
а разве рыцари Круглого стола и викинги не были чернокожими???
  • Анон
игра с формированием ложного самомнения через подхалимаж. ---По образу и подобию .....
  • Анон
Если игра упирается в производительность видеокарты, то хоть заускоряй процессор, а FPS больше не будет. Я у себя на синтетических тестах получил лишь меньшую задержку памяти. В играх практически...
  • Анон
Всё в порядке с физикой: источник может быть меньше четверти длины волны. Даже одиночный ион в ионной ловушке может излучать видимый свет (а размер меньше 0.2нм).
  • Анон
Можно делать смартфоны и планшеты на этом процессоре и наконец то использовать полноценную windows. Это отличная замена процессорам arm
  • Анон
Странно почему не 50 долларов.
  • Анон
Понимаю мощь производительность и все дела, но как черт возьми тепло отделять от камня если его прям нагрузить
  • Анон
Не предвзятость это - "Интересно, что Arc B580 проигрывает RTX 4060 в OpenCL" - где разница на невероятных 3,5 %, "но реабилитируется с НЕЗНАЧИТЕЛЬНЫМ 6%-ным преимуществом в Vulkan.". Не...
  • Анон

Смотреть все