DeepSeek выпускает новую мощную параллельную файловую систему

DeepSeek AI на этой неделе сделала свою параллельную файловую систему Fire-Flyer Fire System (3FS) полностью открытой в рамках своего мероприятия Open Source Week. Прорывная китайская компания AI хвастается, что 3FS может достигать совокупной пропускной способности чтения 7,3 ТБ/с в собственных кластерах данных сервера, где DeepSeek использует 3FS для организации своих серверов по крайней мере с 2019 года.

3FS — это параллельная файловая система на базе Linux, разработанная для использования в операциях AI-HPC, где множество серверов хранения данных постоянно обращаются к узлам GPU для обучения LLM. 3FS отличается от других файловых систем в основном благодаря своему почти исключительному приоритету случайных скоростей чтения над всем остальным и почти полному игнорированию кэширования чтения.

При обучении моделей ИИ вычислительные блоки должны постоянно получать доступ к случайным обучающим данным, а чтение этих данных — это одноразовый процесс. Поэтому кэш чтения практически бесполезен и в значительной степени упразднен 3FS. Фактически, использование кэша чтения при обучении LLM может быть потенциально вредным; поскольку LLM по сути являются просто супернастроенными машинами вывода, многократное чтение одних и тех же данных в одном и том же порядке может связать совершенно разные данные как набор с языковой моделью.

Команда, ответственная за эксплуатацию одного из кластеров глубокого обучения DeepSeek, Fire-Flyer 2, опубликовала эту статью в августе прошлого года, в которой описывалось использование 3FS в специально созданной системе. В Fire-Flyer 2 DeepSeek использовала 180 узлов хранения, каждый из которых был загружен 16 SSD-накопителями по 16 ТБ и двумя NUC 200 Гбит/с. Эти узлы обслуживали 10 000 графических процессоров PCIe Nvidia

NVIDIA Corporation (NASDAQ: NVDA) — американская компания, один из крупнейших разработчиков графических ускорителей и процессоров, а также наборов системной логики. На рынке продукция компании известна под такими торговыми марками как GeForce, nForce, Quadro, Tesla, ION и Tegra. Компания была основана в 1993 году. По состоянию на август 2006 года в корпорации насчитывалось более 8 тысяч сотрудников, работающих в 40 офисах по всему миру. Википедия

Читайте также:Nvidia выпустила хотфикс от чёрного экранаAMD RDNA4 Navi 48 на 25% плотнее, чем у конкурентов NvidiaNVIDIA объясняет, как библиотеки CUDA усиливают кибербезопасность с помощью ИИКонтрабанда процессоров Nvidia: арест в СингапуреNVIDIA DLSS 4 с многокадровой генерацией доступна сегодня в NARAKA: BLADEPOINT

A100, встроенных в гораздо более дешевые серверы, чем фирменные продукты Nvidia DGX-A100.

DeepSeek утверждает, что по всему массиву производительность 3FS составила 6,6 ТБ/с, а также выполняла тренировочные задачи в фоновом режиме, что добавило дополнительные 1,4 ТБ/с пропускной способности чтения. Для сравнения, файловая система конкурента Ceph впервые достигла скорости чтения 1,1 ТБ/с (на сервере с 68 узлами, загруженном 10 16 ТБ SSD и 2 x 100 Гбит/с сетью) только в начале 2024 года.

В вышеуказанной статье 3FS была названа важнейшей частью программного стека DeepSeek для обучения DeepSeek AI, что было протестировано на решении Fire-Flyer 2 HPC, которое достигло 80% производительности серверного решения Nvidia DGX-A100 при 50% его стоимости и 60% энергопотребления.

Те, кому интересно попробовать файловую систему Fire-Flyer и ее стиль случайного чтения вперед для решений AI-HPC, могут найти полную загрузку на странице DeepSeek на Github. Мы были бы удивлены, если бы эта новая система с открытым исходным кодом не стала хитом для энтузиастов и корпоративных пользователей AI-HPC, хотя ей, возможно, придется преодолеть определенный уровень антикитайского технологического страха, чтобы достичь статуса блокбастера.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии