Сверхточная языковая модель малого языка от Nvidia и Mistral AI работает на ноутбуках и ПК

/ ТехнологииНовости / Технологии

Nvidia

NVIDIA Corporation (NASDAQ: NVDA) — американская компания, один из крупнейших разработчиков графических ускорителей и процессоров, а также наборов системной логики. На рынке продукция компании известна под такими торговыми марками как GeForce, nForce, Quadro, Tesla, ION и Tegra. Компания была основана в 1993 году. По состоянию на август 2006 года в корпорации насчитывалось более 8 тысяч сотрудников, работающих в 40 офисах по всему миру. Википедия

Читайте также:Indiana Jones and the Great Circle выйдет 9 декабря и получит поддержку NVIDIA DLSS 3.5Black Myth: Wukong и Star Wars Outlaws с DLSS 3 и трассировкой лучейNVIDIA добавляет Black Myth: Wukong и демоверсию FINAL FANTASY XVI в GeForce NOWNvidia анонсирует 20 новых игр DLSS 3 на GamescomNvidia официально анонсировала новую RTX 4070 с более медленной памятью GDDR6

и Mistral AI выпустили новую малую языковую модель, которая, как утверждается, обладает точностью «наивысшего уровня» в крошечном следе. Новая LM известна как Mistral-NemMo-Minitron 8B, миниатюрная версия NeMo 12B, которая была урезана с 12 миллиардов до 8 миллиардов параметров.
Новая модель малого языка с 8 миллиардами параметров была сжата с помощью двух различных методов оптимизации ИИ

Thumbnail: Искусственный интеллектИску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами. Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия

Читайте также:AMD намерена догнать Nvidia в битве за ИИ с помощью приобретения на сумму 4,9 млрд долларовСоздатель YouTube судится с Nvidia и OpenAI за использование видео в обучении ИИКитайские стартапы выбирают игровые GPU от Nvidia из-за дороговизны аналоговВо втором квартале 2024 года поставлено 8,8 млн ПК с поддержкой ИИИгровые графические процессоры Nvidia с удвоенным объемом видеопамяти для рабочих нагрузок ИИ

, сказал Брайан Катанзаро, вице-президент по исследованиям глубокого обучения в Nvidia, в сообщении в блоге. Команда, стоящая за новым LM, использовала процесс, который сочетает обрезку и дистилляцию. «Обрезка уменьшает размер нейронной сети, удаляя веса модели, которые вносят наименьший вклад в точность. Во время дистилляции команда переобучила эту сокращенную модель на небольшом наборе данных, чтобы значительно повысить точность, которая снизилась из-за процесса обрезки».

Эти оптимизации позволили разработчикам обучить оптимизированную языковую модель на «части исходного набора данных», что привело к экономии затрат до 40 раз с точки зрения сырых вычислений. Обычно модели ИИ должны балансировать между размером модели и точностью, но с новыми методами обрезки и дистилляции Nvidia и Mistral AI языковые модели могут иметь лучшее из обоих миров.

Mistral-NeMo-Minitron 8B, оснащенный этими усовершенствованиями, предположительно лидирует в девяти языковых бенчмарках ИИ с аналогичным размером. Объем сэкономленной вычислительной мощности достаточен для ноутбуков и рабочих станций, чтобы запускать Minitron 8B локально, что делает его более быстрым и безопасным в работе по сравнению с облачными сервисами.

Nvidia разработала Minitron 8B вокруг потребительского компьютерного оборудования. LM упакован как микросервис NIM Nvidia, а модель ИИ оптимизирована для низкой задержки, что улучшает время отклика. Nvidia предоставляет свой собственный сервис моделей AI Foundry, чтобы брать Minitron 8B и манипулировать им для работы на даже менее мощных системах, таких как смартфоны. Точность и производительность не будут такими хорошими, но Nvidia утверждает, что модель все равно будет высокоточным LM, требующим лишь часть обучающих данных и вычислительной инфраструктуры, которые в противном случае понадобились бы.

Обрезка и дистилляция, по-видимому, являются следующим рубежом оптимизации производительности искусственного интеллекта. Теоретически, ничто не мешает разработчикам применять эти методы оптимизации ко всем текущим языковым моделям, что значительно повысит производительность по всем направлениям, включая большие языковые модели, которые могут работать только на фермах серверов с ускорением ИИ.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

Указан неверный диаметр вентиляторов, не 80 мм, а 100 мм. И чип не 103, а 102.
  • Анон
С прошлым обновлением как раз и появилась эта ошибка. А новое как и написано не дают скачать.
  • Анон
При включении 3D Turbo Mode у вас максимум будет доступно 8 ядер и 8 потоков всего. т.е. если у вас 16 ядерный на 32 потока то будет всего 8 ядер и 8 потоков! Странная оптимизация!
  • Анон
После скачивания вышел синий экран СУПЕР!
  • Анон
требуется указать магазин и purchase date без этого не регистрирует
  • Анон
Россия на них клала❤❤❤❤, будет называться Ладушка 2.0 )))
  • Анон
ДА у меня тоже неработает уже все Вы не знаете каким способом вернуть все обратно СПАСИ
  • Анон
Хаетв Рустам Базарвич Хаетв
  • Анон
Очень довольна приложением. Пользуюсь сама и рекомендую другим.
16 способ - Ноутбук HP ProBook 4740s автоматически установлена камера HP HD Webcam [Fixed] при этом онлайн из браузера подключается камера к веб страницам, камера работает. С приложениями камера...
  • Анон

Смотреть все