NVIDIA работает над Llama3.1

/ ТехнологииНовости / Технологии

NVIDIA официально выпустила свою модель Llama-3.1-Nemotron-70B-Instruct. Модель Nemotron, основанная на Llama3.1 70B от META, представляет собой большую языковую модель, настроенную NVIDIA для повышения полезности ответов, сгенерированных LLM. NVIDIA использует тонко настроенные структурированные данные, чтобы направлять модель и позволять ей генерировать более полезные ответы. Имея всего 70 миллиардов параметров, модель намного превосходит свою весовую категорию. Компания утверждает, что модель превосходит текущие топовые модели из ведущих лабораторий, таких как GPT-4o от OpenAI и Claude 3.5 Sonnet от Antrophic, которые являются нынешними лидерами в тестах ИИ. В таких оценках, как Arena Hard, NVIDIA Llama3.1 Nemotron 70B набирает 85 баллов, в то время как GPT-4o и Sonnet 3.5 набирают 79,3 и 79,2 балла соответственно. Другие бенчмарки, такие как AlpacaEval и MT-Bench, также удерживают первое место, набрав 57,6 и 8,98 баллов. Claude и GPT достигают 52,4 / 8,81 и 57,5 / 8,74, чуть ниже Nemotron.

Эта языковая модель прошла обучение с использованием обучения с подкреплением на основе обратной связи с человеком (RLHF), в частности, с использованием алгоритма REINFORCE. Процесс включал модель вознаграждения, основанную на большой архитектуре языковой модели, и пользовательские подсказки предпочтений, разработанные для управления поведением модели. Обучение началось с уже существующей языковой модели с настроенными инструкциями в качестве отправной точки. Она была обучена на подсказках Llama-3.1-Nemotron-70B-Reward и HelpSteer2-Preference на модели Llama-3.1-70B-Instruct в качестве начальной политики. Для локального запуска модели требуется либо четыре 40 ГБ, либо два 80 ГБ VRAM GPU и 150 ГБ свободного места на диске. Нам удалось опробовать ее на веб-сайте NVIDIA, чтобы поприветствовать читателей TechPowerUp. Модель также проходит печально известный «клубничный» тест, в котором ей необходимо подсчитать количество определенных букв в слове, однако, судя по всему, это было частью данных тонкой настройки, поскольку она не проходит следующий тест, показанный на изображении ниже.

Источник: NVIDIA

Подписаться на обновления Новости / Технологии

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• Rutab-Бот читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос и обновите страницу через пару минут 👍
• Rutab-Бот работает в тестовом режиме и может ошибаться, либо просто не знать ответа.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Новые комментарии

Робот «Фёдор» (FEDOR — Final Experimental Demonstration Object Research) — это российский антропоморфный робот, разработанный ФПИ и НПО «Андроидная техника». В 2019 году он даже летал на МКС, но...
  • Rutab
Ошибка 5188 в MemTest86+ указывает на проблему с оперативной памятью (DDR4). Попробуйте следующие шаги: 1. Проверьте каждую планку RAM по отдельности — возможно, одна из них неисправна. 2....
  • Rutab
а разве рыцари Круглого стола и викинги не были чернокожими???
  • Анон
игра с формированием ложного самомнения через подхалимаж. ---По образу и подобию .....
  • Анон
Если игра упирается в производительность видеокарты, то хоть заускоряй процессор, а FPS больше не будет. Я у себя на синтетических тестах получил лишь меньшую задержку памяти. В играх практически...
  • Анон
Всё в порядке с физикой: источник может быть меньше четверти длины волны. Даже одиночный ион в ионной ловушке может излучать видимый свет (а размер меньше 0.2нм).
  • Анон
Можно делать смартфоны и планшеты на этом процессоре и наконец то использовать полноценную windows. Это отличная замена процессорам arm
  • Анон
Странно почему не 50 долларов.
  • Анон
Понимаю мощь производительность и все дела, но как черт возьми тепло отделять от камня если его прям нагрузить
  • Анон
Не предвзятость это - "Интересно, что Arc B580 проигрывает RTX 4060 в OpenCL" - где разница на невероятных 3,5 %, "но реабилитируется с НЕЗНАЧИТЕЛЬНЫМ 6%-ным преимуществом в Vulkan.". Не...
  • Анон

Смотреть все