KIOXIA выпустила ПО AiSAQ для снижения потребности в DRAM

Корпорация Kioxia, мировой лидер в области решений для памяти, сегодня объявила о выпуске с открытым исходным кодом своей новой технологии All-in-Storage ANNS с квантованием продукта (AiSAQ). Новый алгоритм поиска «приблизительного ближайшего соседа» (ANNS), оптимизированный для SSD, программное обеспечение KIOXIA AiSAQ обеспечивает масштабируемую производительность для генерации дополненного поиска (RAG) без размещения индексных данных в DRAM

DRAM (англ. dynamic random access memory — динамическая память с произвольным доступом) — тип компьютерной памяти, отличающийся использованием полупроводниковых материалов, энергозависимостью и возможностью доступа к данным, хранящимся в произвольных ячейках памяти (см. запоминающее устройство с произвольным доступом). Модули памяти с памятью такого типа широко используются в компьютерах в качестве оперативных запоминающих устройств (ОЗУ), также используются в качестве устройств постоянного хранения информации в системах, требовательных к задержкам. Википедия

Читайте также:Transcend выпустила модули DDR5 6400 для ПКImec разрабатывает новую буферную память CXL, которая может превзойти плотность бит DRAMKioxia разрабатывает технологию OCTRAM (оксидно-полупроводниковый канальный транзистор DRAM)NVIDIA демонстрирует будущий дизайн ускорителя ИИ: кремниевая фотоника и DRAM поверх вычисленийSamsung: планы на 2026–2027 гг

— и вместо этого выполняет поиск непосредственно на SSD.

Системы генеративного ИИ требуют значительных вычислительных, оперативных и хранилищных ресурсов. Хотя у них есть потенциал для осуществления преобразующих прорывов в различных отраслях, их развертывание часто сопряжено с высокими затратами. RAG — это критически важный этап ИИ, который уточняет большие языковые модели (LLM) с помощью данных, специфичных для компании или приложения.

Центральным компонентом RAG является векторная база данных, которая накапливает и преобразует определенные данные в векторы признаков в базе данных. RAG также использует алгоритм ANNS, который определяет векторы, улучшающие модель на основе сходства между накопленными и целевыми векторами. Чтобы RAG был эффективным, он должен быстро извлекать информацию, наиболее релевантную запросу. Традиционно алгоритмы ANNS развертываются в DRAM для достижения высокой производительности, необходимой для этих поисков.

Технология KIOXIA AiSAQ обеспечивает масштабируемое и эффективное решение ANNS для миллиардов наборов данных с незначительным использованием памяти и возможностями быстрого переключения индексов.

Основные преимущества технологии KIOXIA AiSAQ:

  • Позволяет работать крупномасштабным базам данных, не полагаясь на ограниченные ресурсы DRAM, повышая производительность систем RAG.
  • Устраняет необходимость загрузки индексных данных в DRAM, позволяя векторной базе данных запускаться мгновенно. Это поддерживает бесшовное переключение между пользовательскими или прикладными базами данных на одном сервере для эффективной доставки услуг RAG.
  • Оптимизирован для облачных систем путем хранения индексов в дезагрегированном хранилище для совместного использования на нескольких серверах. Этот подход динамически регулирует производительность поиска в векторной базе данных для определенных пользователей или приложений и облегчает быструю миграцию экземпляров поиска между физическими серверами.

Компания Kioxia демонстрирует свою приверженность развитию искусственного интеллекта, предоставляя сообществу свою инновационную технологию KIOXIA AiSAQ в виде программного обеспечения с открытым исходным кодом.

Перейдите по ссылке для получения открытой версии KIOXIA AiSAQ: github.com/kioxiaamerica/aisaq-diskann

Источник: KIOXIA

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

Поддерживаю. А еще если брать в разрезе Илон Маск и безопасность данных, то вообще смешно. Особенно для жителей РФ)О конфиденциальности можно забыть
  • Анон
1c пох на ваши операции, количество ядер и прочее. Умудрились написать ядро четко привязанное к Мгц. Единственный в мире продукт для 1го ядра.
  • Анон
Указан неверный диаметр вентиляторов, не 80 мм, а 100 мм. И чип не 103, а 102.
  • Анон
С прошлым обновлением как раз и появилась эта ошибка. А новое как и написано не дают скачать.
  • Анон
При включении 3D Turbo Mode у вас максимум будет доступно 8 ядер и 8 потоков всего. т.е. если у вас 16 ядерный на 32 потока то будет всего 8 ядер и 8 потоков! Странная оптимизация!
  • Анон
После скачивания вышел синий экран СУПЕР!
  • Анон
требуется указать магазин и purchase date без этого не регистрирует
  • Анон
Россия на них клала❤❤❤❤, будет называться Ладушка 2.0 )))
  • Анон
ДА у меня тоже неработает уже все Вы не знаете каким способом вернуть все обратно СПАСИ
  • Анон

Смотреть все