Инсайдер опроверг слухи о запуске DeepSeek-R2 в августе

Ранее сегодня появились слухи, что следующее поколение крупной языковой модели DeepSeek под названием R2 может быть представлено уже в этом месяце. Основанием для таких предположений стали разговоры в китайских технологических кругах и даже намеки самого ИИ DeepSeek в ответ на пользовательские запросы. Модель указывала на временное окно с 15 по 30 августа. Однако всего через несколько часов после появления этой информации источник, близкий к DeepSeek, категорически опроверг слухи, заявив, что компания не планирует запускать R2 в августе.

Что тормозит выход DeepSeek-R2?

Это не первый случай, когда дорожная карта DeepSeek вызывает путаницу. Похожие слухи распространялись ранее в этом году с предполагаемой датой выхода 17 марта, которая также не подтвердилась. Несмотря на ожидания публики, компания до сих пор официально не подтвердила дату релиза и даже не раскрыла ключевые технические характеристики модели R2.

Однако это не мешает спекуляциям. Ожидается, что DeepSeek-R2 совершит значительный прорыв, улучшив мультиязыковое мышление и генерацию кода, что позволит ей конкурировать с топовыми моделями, такими как GPT-4/5. Но, по сообщениям инсайдеров, прогресс застопорился. Как сообщалось в июне в The Information, генеральный директор DeepSeek Лян Вэньфэн до сих пор недоволен производительностью модели, несмотря на месяцы интенсивной разработки.

Задержка связана не только с доработками, но и с инфраструктурными проблемами. DeepSeek работает в условиях ограниченных вычислительных мощностей, особенно после запрета на экспорт чипов Nvidia H20 в Китай. Источники утверждают, что компания опасается, что преждевременный запуск R2 может обернуться провалом, если резкий рост нагрузки перегрузит её системы. В гонке ИИ важна не только производительность, но и масштабируемость.

Для решения проблемы DeepSeek, по слухам, обучает R2 на чипах Huawei Ascend 910B. Вычислительный кластер Huawei, как сообщается, обеспечивает 512 PFLOPS производительности FP16 при 82% загрузке, что эквивалентно примерно 91% производительности кластера Nvidia A100. Однако пока неясно, достаточно ли этого для масштабного запуска модели.

Между тем ситуация с поставками чипов может улучшиться. Всего несколько дней назад Nvidia и AMD договорились с правительством США о разделе доходов, что позволит им продолжать продажи ИИ-чипов в Китай в обмен на 15% выручки. Это может со временем облегчить положение таких компаний, как DeepSeek, хотя эффект будет не мгновенным.

Таким образом, несмотря на намеки самой модели DeepSeek о скором релизе, компания занимает гораздо более осторожную позицию. R2 существует, он проходит активное тестирование, но пока не готов к выходу. В условиях жесткой конкуренции в сфере ИИ DeepSeek нужна не просто хорошая модель, а стабильная, масштабируемая и готовая к рынку.

Пока же внимание остается прикованным к DeepSeek — мир ждет, сможет ли R2 оправдать растущие ожидания.

(Источник)

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии