Инсайдер опроверг слухи о запуске DeepSeek-R2 в августе
Ранее сегодня появились слухи, что следующее поколение крупной языковой модели DeepSeek под названием R2 может быть представлено уже в этом месяце. Основанием для таких предположений стали разговоры в китайских технологических кругах и даже намеки самого ИИ DeepSeek в ответ на пользовательские запросы. Модель указывала на временное окно с 15 по 30 августа. Однако всего через несколько часов после появления этой информации источник, близкий к DeepSeek, категорически опроверг слухи, заявив, что компания не планирует запускать R2 в августе.
Что тормозит выход DeepSeek-R2?
Это не первый случай, когда дорожная карта DeepSeek вызывает путаницу. Похожие слухи распространялись ранее в этом году с предполагаемой датой выхода 17 марта, которая также не подтвердилась. Несмотря на ожидания публики, компания до сих пор официально не подтвердила дату релиза и даже не раскрыла ключевые технические характеристики модели R2.
Однако это не мешает спекуляциям. Ожидается, что DeepSeek-R2 совершит значительный прорыв, улучшив мультиязыковое мышление и генерацию кода, что позволит ей конкурировать с топовыми моделями, такими как GPT-4/5. Но, по сообщениям инсайдеров, прогресс застопорился. Как сообщалось в июне в The Information, генеральный директор DeepSeek Лян Вэньфэн до сих пор недоволен производительностью модели, несмотря на месяцы интенсивной разработки.
Задержка связана не только с доработками, но и с инфраструктурными проблемами. DeepSeek работает в условиях ограниченных вычислительных мощностей, особенно после запрета на экспорт чипов Nvidia H20 в Китай. Источники утверждают, что компания опасается, что преждевременный запуск R2 может обернуться провалом, если резкий рост нагрузки перегрузит её системы. В гонке ИИ важна не только производительность, но и масштабируемость.
Для решения проблемы DeepSeek, по слухам, обучает R2 на чипах Huawei Ascend 910B. Вычислительный кластер Huawei, как сообщается, обеспечивает 512 PFLOPS производительности FP16 при 82% загрузке, что эквивалентно примерно 91% производительности кластера Nvidia A100. Однако пока неясно, достаточно ли этого для масштабного запуска модели.
Между тем ситуация с поставками чипов может улучшиться. Всего несколько дней назад Nvidia и AMD договорились с правительством США о разделе доходов, что позволит им продолжать продажи ИИ-чипов в Китай в обмен на 15% выручки. Это может со временем облегчить положение таких компаний, как DeepSeek, хотя эффект будет не мгновенным.
Таким образом, несмотря на намеки самой модели DeepSeek о скором релизе, компания занимает гораздо более осторожную позицию. R2 существует, он проходит активное тестирование, но пока не готов к выходу. В условиях жесткой конкуренции в сфере ИИ DeepSeek нужна не просто хорошая модель, а стабильная, масштабируемая и готовая к рынку.
Пока же внимание остается прикованным к DeepSeek — мир ждет, сможет ли R2 оправдать растущие ожидания.
(Источник)
0 комментариев