DeepSeek выпускает новую мощную параллельную файловую систему

DeepSeek AI на этой неделе сделала свою параллельную файловую систему Fire-Flyer Fire System (3FS) полностью открытой в рамках своего мероприятия Open Source Week. Прорывная китайская компания AI хвастается, что 3FS может достигать совокупной пропускной способности чтения 7,3 ТБ/с в собственных кластерах данных сервера, где DeepSeek использует 3FS для организации своих серверов по крайней мере с 2019 года.

3FS — это параллельная файловая система на базе Linux, разработанная для использования в операциях AI-HPC, где множество серверов хранения данных постоянно обращаются к узлам GPU для обучения LLM. 3FS отличается от других файловых систем в основном благодаря своему почти исключительному приоритету случайных скоростей чтения над всем остальным и почти полному игнорированию кэширования чтения.

При обучении моделей ИИ вычислительные блоки должны постоянно получать доступ к случайным обучающим данным, а чтение этих данных — это одноразовый процесс. Поэтому кэш чтения практически бесполезен и в значительной степени упразднен 3FS. Фактически, использование кэша чтения при обучении LLM может быть потенциально вредным; поскольку LLM по сути являются просто супернастроенными машинами вывода, многократное чтение одних и тех же данных в одном и том же порядке может связать совершенно разные данные как набор с языковой моделью.

Команда, ответственная за эксплуатацию одного из кластеров глубокого обучения DeepSeek, Fire-Flyer 2, опубликовала эту статью в августе прошлого года, в которой описывалось использование 3FS в специально созданной системе. В Fire-Flyer 2 DeepSeek использовала 180 узлов хранения, каждый из которых был загружен 16 SSD-накопителями по 16 ТБ и двумя NUC 200 Гбит/с. Эти узлы обслуживали 10 000 графических процессоров PCIe Nvidia

NVIDIA Corporation (NASDAQ: NVDA) — американская компания, один из крупнейших разработчиков графических ускорителей и процессоров, а также наборов системной логики. На рынке продукция компании известна под такими торговыми марками как GeForce, nForce, Quadro, Tesla, ION и Tegra. Компания была основана в 1993 году. По состоянию на август 2006 года в корпорации насчитывалось более 8 тысяч сотрудников, работающих в 40 офисах по всему миру. Википедия

Читайте также:Nvidia выпустила хотфикс от чёрного экранаAMD RDNA4 Navi 48 на 25% плотнее, чем у конкурентов NvidiaNVIDIA объясняет, как библиотеки CUDA усиливают кибербезопасность с помощью ИИКонтрабанда процессоров Nvidia: арест в СингапуреNVIDIA DLSS 4 с многокадровой генерацией доступна сегодня в NARAKA: BLADEPOINT

A100, встроенных в гораздо более дешевые серверы, чем фирменные продукты Nvidia DGX-A100.

DeepSeek утверждает, что по всему массиву производительность 3FS составила 6,6 ТБ/с, а также выполняла тренировочные задачи в фоновом режиме, что добавило дополнительные 1,4 ТБ/с пропускной способности чтения. Для сравнения, файловая система конкурента Ceph впервые достигла скорости чтения 1,1 ТБ/с (на сервере с 68 узлами, загруженном 10 16 ТБ SSD и 2 x 100 Гбит/с сетью) только в начале 2024 года.

В вышеуказанной статье 3FS была названа важнейшей частью программного стека DeepSeek для обучения DeepSeek AI, что было протестировано на решении Fire-Flyer 2 HPC, которое достигло 80% производительности серверного решения Nvidia DGX-A100 при 50% его стоимости и 60% энергопотребления.

Те, кому интересно попробовать файловую систему Fire-Flyer и ее стиль случайного чтения вперед для решений AI-HPC, могут найти полную загрузку на странице DeepSeek на Github. Мы были бы удивлены, если бы эта новая система с открытым исходным кодом не стала хитом для энтузиастов и корпоративных пользователей AI-HPC, хотя ей, возможно, придется преодолеть определенный уровень антикитайского технологического страха, чтобы достичь статуса блокбастера.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

Когда они в продаже появятся? Уже как бы конец февраля, а нигде нет..
  • Анон
Поддерживаю. А еще если брать в разрезе Илон Маск и безопасность данных, то вообще смешно. Особенно для жителей РФ)О конфиденциальности можно забыть
  • Анон
1c пох на ваши операции, количество ядер и прочее. Умудрились написать ядро четко привязанное к Мгц. Единственный в мире продукт для 1го ядра.
  • Анон
Указан неверный диаметр вентиляторов, не 80 мм, а 100 мм. И чип не 103, а 102.
  • Анон
С прошлым обновлением как раз и появилась эта ошибка. А новое как и написано не дают скачать.
  • Анон
При включении 3D Turbo Mode у вас максимум будет доступно 8 ядер и 8 потоков всего. т.е. если у вас 16 ядерный на 32 потока то будет всего 8 ядер и 8 потоков! Странная оптимизация!
  • Анон
После скачивания вышел синий экран СУПЕР!
  • Анон
требуется указать магазин и purchase date без этого не регистрирует
  • Анон
Россия на них клала❤❤❤❤, будет называться Ладушка 2.0 )))
  • Анон

Смотреть все