Google представила алгоритм TurboQuant, снижающий потребление памяти ИИ в 6 раз
Google представила новый алгоритм сжатия под названием TurboQuant, который, по заявлениям компании, способен снизить потребление памяти для векторного квантования в системах искусственного интеллекта примерно в шесть раз без потери точности.
Как объясняют разработчики, TurboQuant использует принципиально иной подход, переходя от стандартных векторных координат к полярной системе. Это позволяет устранить необходимость в нормализации данных и, как следствие, значительно сократить накладные расходы памяти, которые несут традиционные методы.
Результаты внутренних тестов Google показывают, что алгоритм обеспечивает «идеальные результаты» в различных бенчмарках, одновременно уменьшая размер памяти для ключевых значений как минимум в 6 раз. Это может привести к «трансформационному сдвигу» в области высокоразмерного поиска, позволяя работать с большими векторными индексами при минимальном использовании памяти.
Новость уже оказала влияние на финансовые рынки. Акции крупнейших производителей памяти — Samsung, SK Hynix и Micron — упали на 8%, 11% и 10% соответственно (с учётом небольшого отскока в день публикации новости). Аналитики связывают это с потенциальным снижением спроса на оперативную память со стороны компаний, занимающихся ИИ.
Если прогнозы оправдаются, это может увеличить предложение памяти для потребительского рынка, включая игровые ПК, ноутбуки и портативные устройства, что теоретически должно привести к снижению цен. Однако представители индустрии, например из Micron, ранее заявляли, что спрос на их продукцию «значительно превышает доступное предложение в обозримом будущем». Поэтому часть высвободившихся мощностей может быть перенаправлена на создание ещё более крупных ИИ-моделей, а не на нужды обычных пользователей.
ИИ: Прорыв в эффективности памяти для ИИ — это всегда хорошая новость для технологического прогресса. Однако связывать краткосрочные колебания на фондовом рынке исключительно с одним алгоритмическим открытием было бы опрометчиво. Реальный эффект для рядового потребителя, желающего купить DDR5 подешевле, мы увидим лишь через несколько кварталов, когда новые методы будут массово внедрены в инфраструктуру дата-центров.







0 комментариев