AMD запускает GAIA — проект LLM для Ryzen AI NPU

AMD

Advanced Micro Devices, Inc. (AMD, дословный перевод с англ. — «передовые микроустройства») — производитель интегральной микросхемной электроники. Второй по объему производства и продаж производитель процессоров архитектуры x86 c долей рынка 16,9 %▲(2014), а также один из крупнейших производителей графических процессоров (после приобретения ATI Technologies в 2006 году), чипсетов для материнских плат и флеш-памяти. Компания с 2009 года не имеет собственного производства и размещает заказы на мощностях других компаний. Википедия

Читайте также:AMD запускает проект Gaia с открытым исходным кодом для локального запуска LLM на любом ПКAMD Ryzen Threadripper 9975WX и 9965WX на базе «Zen 5» SurfaceУскорение графики в 10 раз благодаря новым технологиямPowerColor Red Devil AMD RX 9070 получит свежий слой краски с утечкой Spectral White EditionРемастер The Last of Us: Part 2 — системные требования и размер

запустила новый проект с открытым исходным кодом под названием GAIA (произносится как /ˈɡaɪ.ə/), потрясающее приложение, которое использует мощь Ryzen

Ryzen (/ˈraɪzən/, рус. ра́йзен) — торговая марка микропроцессоров транснациональной корпорации AMD второй половины 2010-х годов. Данное семейство процессоров относится к архитектуре x86_64, применяется в настольных, мобильных и встроенных вычислительных системах и на данный момент использует процессорные микроархитектуры Zen, Zen+, Zen 2, Zen 3. 13 декабря 2016 года марка Ryzen была анонсирована на специальном саммите AMD New Horizon, одновременно с новой микроархитектурой Zen. Википедия

Читайте также:AMD Ryzen Threadripper 9975WX и 9965WX на базе «Zen 5» SurfaceРемастер The Last of Us: Part 2 — системные требования и размерПовышение производительности AMD Ryzen 9 9950X3D: оптимизации MSI BIOS обеспечивают прирост до 14,5%Asus представила AI Cache Boost для Ryzen 9000GMKtec выпустила мини-ПК EVO-X2 с Ryzen AI Max+ 395

AI Neural Processing Unit (NPU) для запуска частных и локальных больших языковых моделей (LLM). В этом блоге мы углубимся в особенности и преимущества GAIA, а также расскажем, как вы можете воспользоваться проектом GAIA с открытым исходным кодом для внедрения в свои собственные приложения.

Введение в GAIA
GAIA — это генеративное приложение ИИ, разработанное для запуска локальных, частных LLM на ПК с Windows и оптимизированное для оборудования AMD Ryzen AI (процессоры AMD Ryzen AI 300 серии). Эта интеграция обеспечивает более быструю и эффективную обработку — т. е. более низкое энергопотребление — при этом ваши данные остаются локальными и безопасными. На ПК с Ryzen AI GAIA взаимодействует с NPU и iGPU для бесперебойного запуска моделей с помощью открытого исходного кода Lemonade (LLM-Aid) SDK от ONNX TurnkeyML для вывода LLM. GAIA поддерживает различные локальные LLM, оптимизированные для запуска на ПК с Ryzen AI. Популярные модели, такие как производные Llama и Phi, можно адаптировать для различных вариантов использования, таких как вопросы и ответы, резюмирование и сложные задачи рассуждения.

Начало работы с GAIA
Чтобы начать работу с GAIA менее чем за 10 минут. Следуйте инструкциям по загрузке и установке GAIA на ваш ПК Ryzen AI. После установки вы можете запустить GAIA и начать изучать ее различные агенты и возможности. Существует 2 версии GAIA:

  • 1) Установщик GAIA — он запустится на любом ПК с ОС Windows, однако производительность может быть ниже.
  • 2) Гибридный установщик GAIA — этот пакет оптимизирован для работы на ПК с процессорами Ryzen AI и использует NPU и iGPU для повышения производительности.

Агент RAG Pipeline
Одной из выдающихся особенностей GAIA является конвейер Retrieval-Augmented Generation (RAG) агента. Этот конвейер объединяет LLM с базой знаний, позволяя агенту извлекать соответствующую информацию, рассуждать, планировать и использовать внешние инструменты в интерактивной среде чата. Это приводит к более точным и контекстно-зависимым ответам.

Текущие агенты GAIA предоставляют следующие возможности:

  • Простое оперативное заполнение: нет агента для прямого взаимодействия с моделью для тестирования и оценки.
  • Chaty: чат-бот LLM с историей, который вступает в беседу с пользователем.
  • Клип: Agentic RAG для поиска на YouTube и агента вопросов и ответов.
  • Джокер: простой генератор шуток, использующий RAG, чтобы подарить пользователю чувство юмора.

В настоящее время разрабатываются дополнительные агенты, и разработчикам предлагается создать и добавить в GAIA своих собственных агентов.

Как работает GAIA?
Левая часть рисунка 2: Обзорная диаграмма GAIA иллюстрирует функциональность Lemonade SDK от TurnkeyML. Lemonade SDK предоставляет инструменты для задач, специфичных для LLM, таких как подсказки, измерение точности и обслуживание в нескольких средах выполнения (например, Hugging Face, ONNX Runtime GenAI API) и аппаратных средствах (CPU, iGPU и NPU).

Lemonade предоставляет веб-сервис LLM, который взаимодействует с приложением GAIA (справа) через совместимый с OpenAI REST API. GAIA состоит из трех ключевых компонентов:

  • 1) LLM Connector — соединяет веб-API службы NPU с конвейером RAG на основе LlamaIndex.
  • 2) LlamaIndex RAG Pipeline — включает в себя механизм запросов и векторную память, которая обрабатывает и хранит соответствующую внешнюю информацию.
  • 3) Веб-сервер агента — подключается к пользовательскому интерфейсу GAIA через WebSocket, обеспечивая взаимодействие с пользователем.

С правой стороны рисунка GAIA действует как агент на базе ИИ, который извлекает и обрабатывает данные. Он векторизует внешний контент (например, GitHub, YouTube, текстовые файлы) и сохраняет его в локальном векторном индексе. Когда пользователь отправляет запрос, происходит следующий процесс:

  • 1) Запрос отправляется в GAIA, где он преобразуется в вектор внедрения.
  • 2) Векторизованный запрос используется для извлечения соответствующего контекста из индексированных данных.
  • 3) Извлеченный контекст передается в веб-службу, где он встраивается в приглашение LLM.
  • 4) LLM генерирует ответ, который передается обратно через веб-сервис GAIA и отображается в пользовательском интерфейсе.

Этот процесс гарантирует, что пользовательские запросы будут дополнены соответствующим контекстом перед обработкой LLM, что повышает точность и релевантность ответа. Окончательный ответ доставляется пользователю в режиме реального времени через пользовательский интерфейс.

Преимущества локального управления LLM
Локальное выполнение LLM на NPU имеет ряд преимуществ:

  • Улучшенная конфиденциальность, поскольку никакие данные не должны покидать вашу машину. Это устраняет необходимость отправки конфиденциальной информации в облако, значительно повышая конфиденциальность и безопасность данных, при этом обеспечивая высокопроизводительные возможности ИИ.
  • Сокращение задержек, поскольку нет необходимости взаимодействовать с облаком.
  • Оптимизированная производительность с помощью NPU, обеспечивающая более быстрое время отклика и снижение энергопотребления.

Сравнение NPU и iGPU
Запуск GAIA на NPU приводит к повышению производительности для задач, специфичных для ИИ, поскольку он разработан для рабочих нагрузок вывода. Начиная с Ryzen AI Software Release 1.3, существует гибридная поддержка развертывания квантованных LLM, которые используют как NPU, так и iGPU. Используя оба компонента, каждый из них может применяться к задачам и операциям, для которых они оптимизированы.

Приложения и отрасли
Эта настройка может принести пользу отраслям, которым требуется высокая производительность и конфиденциальность, таким как здравоохранение, финансы и корпоративные приложения, где конфиденциальность данных имеет решающее значение. Ее также можно применять в таких областях, как создание контента и автоматизация обслуживания клиентов, где генеративные модели ИИ становятся необходимыми. Наконец, она помогает отраслям без Wi-Fi отправлять данные в облако и получать ответы, поскольку вся обработка выполняется локально.

Conclusion
В заключение, GAIA, приложение AMD с открытым исходным кодом, использует мощь Ryzen AI NPU для предоставления эффективных, приватных и высокопроизводительных LLM. Запуская LLM локально, GAIA обеспечивает повышенную конфиденциальность, уменьшенную задержку и оптимизированную производительность, что делает его идеальным для отраслей, в которых приоритет отдается безопасности данных и быстрому времени отклика.

Готовы ли вы попробовать GAIA самостоятельно? В нашем видео представлен краткий обзор и демонстрация установки GAIA.

Проверьте и внесите свой вклад в репозиторий GAIA на github.com/amd/gaia. Для отзывов или вопросов, пожалуйста, свяжитесь с нами по адресу GAIA@amd.com.

Источник: AMD Developer Blog

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

И теперь нельзя отключить авто обновление!!! Это жесть
  • Анон
Не знаю, я купил Cougar850 80Gold за 10К₽ и нормально
  • Анон
После всех роликов я одно понял у этой игры которую выпустят 20 мая у неё большое будущее
  • Анон
Когда они в продаже появятся? Уже как бы конец февраля, а нигде нет..
  • Анон
Поддерживаю. А еще если брать в разрезе Илон Маск и безопасность данных, то вообще смешно. Особенно для жителей РФ)О конфиденциальности можно забыть
  • Анон
1c пох на ваши операции, количество ядер и прочее. Умудрились написать ядро четко привязанное к Мгц. Единственный в мире продукт для 1го ядра.
  • Анон
Указан неверный диаметр вентиляторов, не 80 мм, а 100 мм. И чип не 103, а 102.
  • Анон
С прошлым обновлением как раз и появилась эта ошибка. А новое как и написано не дают скачать.
  • Анон
При включении 3D Turbo Mode у вас максимум будет доступно 8 ядер и 8 потоков всего. т.е. если у вас 16 ядерный на 32 потока то будет всего 8 ядер и 8 потоков! Странная оптимизация!
  • Анон

Смотреть все