DeepSeek выпускает новую мощную параллельную файловую систему
DeepSeek AI на этой неделе сделала свою параллельную файловую систему Fire-Flyer Fire System (3FS) полностью открытой в рамках своего мероприятия Open Source Week. Прорывная китайская компания AI хвастается, что 3FS может достигать совокупной пропускной способности чтения 7,3 ТБ/с в собственных кластерах данных сервера, где DeepSeek использует 3FS для организации своих серверов по крайней мере с 2019 года.
3FS — это параллельная файловая система на базе Linux, разработанная для использования в операциях AI-HPC, где множество серверов хранения данных постоянно обращаются к узлам GPU для обучения LLM. 3FS отличается от других файловых систем в основном благодаря своему почти исключительному приоритету случайных скоростей чтения над всем остальным и почти полному игнорированию кэширования чтения.
При обучении моделей ИИ вычислительные блоки должны постоянно получать доступ к случайным обучающим данным, а чтение этих данных — это одноразовый процесс. Поэтому кэш чтения практически бесполезен и в значительной степени упразднен 3FS. Фактически, использование кэша чтения при обучении LLM может быть потенциально вредным; поскольку LLM по сути являются просто супернастроенными машинами вывода, многократное чтение одних и тех же данных в одном и том же порядке может связать совершенно разные данные как набор с языковой моделью.
NVIDIA Corporation (NASDAQ: NVDA) — американская компания, один из крупнейших разработчиков графических ускорителей и процессоров, а также наборов системной логики. На рынке продукция компании известна под такими торговыми марками как GeForce, nForce, Quadro, Tesla, ION и Tegra. Компания была основана в 1993 году. По состоянию на август 2006 года в корпорации насчитывалось более 8 тысяч сотрудников, работающих в 40 офисах по всему миру. Википедия
Читайте также:Nvidia выпустила хотфикс от чёрного экранаAMD RDNA4 Navi 48 на 25% плотнее, чем у конкурентов NvidiaNVIDIA объясняет, как библиотеки CUDA усиливают кибербезопасность с помощью ИИКонтрабанда процессоров Nvidia: арест в СингапуреNVIDIA DLSS 4 с многокадровой генерацией доступна сегодня в NARAKA: BLADEPOINT
DeepSeek утверждает, что по всему массиву производительность 3FS составила 6,6 ТБ/с, а также выполняла тренировочные задачи в фоновом режиме, что добавило дополнительные 1,4 ТБ/с пропускной способности чтения. Для сравнения, файловая система конкурента Ceph впервые достигла скорости чтения 1,1 ТБ/с (на сервере с 68 узлами, загруженном 10 16 ТБ SSD и 2 x 100 Гбит/с сетью) только в начале 2024 года.
В вышеуказанной статье 3FS была названа важнейшей частью программного стека DeepSeek для обучения DeepSeek AI, что было протестировано на решении Fire-Flyer 2 HPC, которое достигло 80% производительности серверного решения Nvidia DGX-A100 при 50% его стоимости и 60% энергопотребления.
Те, кому интересно попробовать файловую систему Fire-Flyer и ее стиль случайного чтения вперед для решений AI-HPC, могут найти полную загрузку на странице DeepSeek на Github. Мы были бы удивлены, если бы эта новая система с открытым исходным кодом не стала хитом для энтузиастов и корпоративных пользователей AI-HPC, хотя ей, возможно, придется преодолеть определенный уровень антикитайского технологического страха, чтобы достичь статуса блокбастера.
Источник: Tomshardware.com
0 комментариев