KIOXIA выпустила ПО AiSAQ для снижения потребности в DRAM

Корпорация Kioxia, мировой лидер в области решений для памяти, сегодня объявила о выпуске с открытым исходным кодом своей новой технологии All-in-Storage ANNS с квантованием продукта (AiSAQ). Новый алгоритм поиска «приблизительного ближайшего соседа» (ANNS), оптимизированный для SSD, программное обеспечение KIOXIA AiSAQ обеспечивает масштабируемую производительность для генерации дополненного поиска (RAG) без размещения индексных данных в DRAM

DRAM (англ. dynamic random access memory — динамическая память с произвольным доступом) — тип компьютерной памяти, отличающийся использованием полупроводниковых материалов, энергозависимостью и возможностью доступа к данным, хранящимся в произвольных ячейках памяти (см. запоминающее устройство с произвольным доступом). Модули памяти с памятью такого типа широко используются в компьютерах в качестве оперативных запоминающих устройств (ОЗУ), также используются в качестве устройств постоянного хранения информации в системах, требовательных к задержкам. Википедия

Читайте также:Transcend выпустила модули DDR5 6400 для ПКImec разрабатывает новую буферную память CXL, которая может превзойти плотность бит DRAMKioxia разрабатывает технологию OCTRAM (оксидно-полупроводниковый канальный транзистор DRAM)NVIDIA демонстрирует будущий дизайн ускорителя ИИ: кремниевая фотоника и DRAM поверх вычисленийSamsung: планы на 2026–2027 гг

— и вместо этого выполняет поиск непосредственно на SSD.

Системы генеративного ИИ требуют значительных вычислительных, оперативных и хранилищных ресурсов. Хотя у них есть потенциал для осуществления преобразующих прорывов в различных отраслях, их развертывание часто сопряжено с высокими затратами. RAG — это критически важный этап ИИ, который уточняет большие языковые модели (LLM) с помощью данных, специфичных для компании или приложения.

Центральным компонентом RAG является векторная база данных, которая накапливает и преобразует определенные данные в векторы признаков в базе данных. RAG также использует алгоритм ANNS, который определяет векторы, улучшающие модель на основе сходства между накопленными и целевыми векторами. Чтобы RAG был эффективным, он должен быстро извлекать информацию, наиболее релевантную запросу. Традиционно алгоритмы ANNS развертываются в DRAM для достижения высокой производительности, необходимой для этих поисков.

Технология KIOXIA AiSAQ обеспечивает масштабируемое и эффективное решение ANNS для миллиардов наборов данных с незначительным использованием памяти и возможностями быстрого переключения индексов.

Основные преимущества технологии KIOXIA AiSAQ:

  • Позволяет работать крупномасштабным базам данных, не полагаясь на ограниченные ресурсы DRAM, повышая производительность систем RAG.
  • Устраняет необходимость загрузки индексных данных в DRAM, позволяя векторной базе данных запускаться мгновенно. Это поддерживает бесшовное переключение между пользовательскими или прикладными базами данных на одном сервере для эффективной доставки услуг RAG.
  • Оптимизирован для облачных систем путем хранения индексов в дезагрегированном хранилище для совместного использования на нескольких серверах. Этот подход динамически регулирует производительность поиска в векторной базе данных для определенных пользователей или приложений и облегчает быструю миграцию экземпляров поиска между физическими серверами.

Компания Kioxia демонстрирует свою приверженность развитию искусственного интеллекта, предоставляя сообществу свою инновационную технологию KIOXIA AiSAQ в виде программного обеспечения с открытым исходным кодом.

Перейдите по ссылке для получения открытой версии KIOXIA AiSAQ: github.com/kioxiaamerica/aisaq-diskann

Источник: KIOXIA

Подписаться на обновления Новости / Технологии

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• Rutab-Бот читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос и обновите страницу через пару минут 👍
• Rutab-Бот работает в тестовом режиме и может ошибаться, либо просто не знать ответа.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Новые комментарии

Ошибка 5188 в MemTest86+ указывает на проблему с оперативной памятью (DDR4). Попробуйте следующие шаги: 1. Проверьте каждую планку RAM по отдельности — возможно, одна из них неисправна. 2....
  • Rutab
Пользователь намекает на схожесть робота Tesla Optimus с антропоморфными роботами из игры Atomic Heart , где они тоже обладают плавными движениями и «человечными» формами 😄 Действительно, если...
  • Rutab
а разве рыцари Круглого стола и викинги не были чернокожими???
  • Анон
игра с формированием ложного самомнения через подхалимаж. ---По образу и подобию .....
  • Анон
Если игра упирается в производительность видеокарты, то хоть заускоряй процессор, а FPS больше не будет. Я у себя на синтетических тестах получил лишь меньшую задержку памяти. В играх практически...
  • Анон
Всё в порядке с физикой: источник может быть меньше четверти длины волны. Даже одиночный ион в ионной ловушке может излучать видимый свет (а размер меньше 0.2нм).
  • Анон
Можно делать смартфоны и планшеты на этом процессоре и наконец то использовать полноценную windows. Это отличная замена процессорам arm
  • Анон
Странно почему не 50 долларов.
  • Анон
Понимаю мощь производительность и все дела, но как черт возьми тепло отделять от камня если его прям нагрузить
  • Анон
Не предвзятость это - "Интересно, что Arc B580 проигрывает RTX 4060 в OpenCL" - где разница на невероятных 3,5 %, "но реабилитируется с НЕЗНАЧИТЕЛЬНЫМ 6%-ным преимуществом в Vulkan.". Не...
  • Анон

Смотреть все