Пользователи протестировали DeepSeek V4 Lite: модель «проглотила» весь текст «Задачи трёх тел» и показала ум
На прошлой неделе ходили слухи о выпуске крупной языковой модели DeepSeek V4, но этого не произошло. Вместо этого компания DeepSeek опубликовала на своём официальном сайте облегчённую версию, которую пользователи сети окрестили DeepSeek V4 Lite.
Согласно данным, DeepSeek V4 Lite имеет 200 миллиардов параметров, что значительно меньше, чем 670+ миллиардов параметров у версии V3. Ожидается, что полноценная DeepSeek V4 будет иметь триллион параметров. Поэтому считается, что V4 Lite — это инструмент для тестирования и проверки, облегчающий последующую тонкую настройку основной модели.
Официальной информации о модели немного. Ключевым улучшением стало увеличение длины контекста — со 128 тысяч токенов до 1 миллиона. Хотя это всё ещё меньше, чем 2 миллиона у некоторых крупных моделей, пользовательские тесты подтвердили, что заявленный миллион — реальность, а на практике возможности могут быть даже больше.
Пользователь @帅得自然 (Shuai de ziran) отметил, что веб-версия для программирования стала «в 10 раз лучше, чем раньше», и это уже не иллюзия. Более того, если дать ей текстовый файл с кодом размером 1 МБ, она обычно справляется за один проход, максимум за три.
Другой пользователь, @LateStageOfNamingDifficulty, провёл более интересный тест. Он отправил DeepSeek V4 Lite файл размером 2,9 МБ, содержащий полный текст романа Лю Цысиня «Задача трёх тел», но предварительно случайным образом добавил в текст несколько ключевых слов, попросив ИИ их найти. Это классический тест на понимание длинного контекста.
DeepSeek V4 Lite успешно справилась с задачей. В первый раз порядок был немного нарушен, но после уточнения модель предоставила подробные объяснения и чётко указала местоположение каждого ключевого слова.
Полный текст трилогии «Задача трёх тел» содержит около 800 000 слов. Хотя объём текста сам по себе демонстрирует контекстные возможности, этот тест показывает, что DeepSeek V4 Lite теперь может осмысленно обрабатывать миллионы слов. В сочетании с серьёзным улучшением в программировании, её практическая ценность выглядит весьма конкурентоспособной.
Дата выхода полной версии DeepSeek V4 пока неизвестна, как и её конкретные возможности. Однако, судя по текущим результатам облегчённой версии, DeepSeek V4 имеет все шансы преподнести сюрприз, и ожидания от неё очень высоки.
ИИ: Интересно, что тест на «Задачу трёх тел» — это не только проверка технических возможностей, но и своеобразная дань уважения произведению, которое стало культурным феноменом в научной фантастике. Увеличение контекстного окна до миллиона токенов открывает двери для анализа целых книг, длинных юридических документов или сложных кодобаз, что может кардинально изменить подход к работе с информацией.










0 комментариев