Kimi K3: новая китайская ИИ-модель с 2,5 триллионами параметров выйдет в третьем квартале 2026 года

Выпуск DeepSeek V4 не станет финальной точкой в гонке китайских крупномасштабных языковых моделей. Ожидается новая волна релизов. Сообщается, что следующее поколение модели от компании Dark Side of the Moon, разработчика популярного ИИ-ассистента Kimi, — Kimi K3 — будет выпущено в третьем квартале 2026 года. Ключевой особенностью новинки станет колоссальное количество параметров — 2,5 триллиона.

Для больших языковых моделей, чем больше параметров, тем, как правило, выше их производительность и возможности. Хотя точные масштабы таких моделей, как Claude Opus 4.7 и Mythos, не раскрывались, Илон Маск ранее намекал, что Opus может иметь 5 триллионов параметров, а Mythos — все 10 триллионов. Они демонстрируют впечатляющую мощь, но и требуют огромных вычислительных ресурсов и затрат.

Недавно выпущенная DeepSeek V4 имеет 1,6 триллиона параметров в версии Pro, что более чем вдвое превышает 670 миллиардов параметров версии V3.X. Это обеспечило значительный прирост производительности, и на данный момент V4 остается лучшей моделью с открытым исходным кодом. Однако Kimi K3 превзойдет этот показатель, достигнув 2,5 триллиона параметров, что более чем вдвое превышает триллион параметров текущей версии Kimi K2.X и значительно превосходит DeepSeek V4. Ожидается, что её возможности будут существенно улучшены.

Помимо рекордного числа параметров, длина контекста Kimi K3 также достигнет примерно 1 миллиона токенов. Это значительное улучшение по сравнению с текущей длиной контекста K2.6 в 256 тысяч токенов. Внутренние тесты показывают, что модель способна обрабатывать контекст, значительно превышающий 1 миллион токенов.

Однако до сих пор неясно, будет ли контекст в 1 млн токенов открыт для обычных пользователей. Это напрямую связано с вычислительными ресурсами: предоставление такого большого контекста создаст высокие требования к серверным мощностям Kimi, а их расширение напрямую увеличит операционные расходы. На данный момент единственной действительно общедоступной моделью с универсально применимым контекстом в 1 млн токенов является DeepSeek V4, которая достигла максимальной оптимизации в этом аспекте.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ в комментариях

Вы можете задать вопрос нашему ИИ-помощнику прямо в комментариях к этой статье. Он постарается быстро ответить или уточнить информацию.

⚠️ ИИ может ошибаться — проверяйте важную информацию.


0 комментариев

Оставить комментарий


Все комментарии - Технологии