Илон Маск подтвердил, что Grok 3 скоро выйдет

Илон Маск объявил, что большая языковая модель Grok 3 (LLM) от xAI прошла предварительную подготовку и потребовала в 10 раз больше вычислительной мощности, чем Grok 2. Он не раскрыл подробностей, но, судя по времени, Grok 3 LLM прошла предварительную подготовку на суперкластере Colossus, который содержит около 100 000 графических процессоров Nvidia H100.

«Grok 3 выйдет скоро», — написал Илон Маск в посте X. «Предварительное обучение уже завершено, и вычислений в 10 раз больше, чем у Grok 2».

Учитывая время и контекст, это подтверждает предыдущие сообщения о том, что суперкомпьютер Colossus от xAI, который может похвастаться примерно 100 000 графическими процессорами Nvidia H100, был специально создан для ускорения крупномасштабных проектов ИИ. Упоминание о десятикратном «большем количестве вычислений, чем у Grok 2» еще раз подтверждает идею о том, что предварительное обучение Grok 3 использовало эту огромную вычислительную инфраструктуру. По понятным причинам Grok 3 использовал данные, сгенерированные пользователями X.

Конкретные подробности о вычислительной инфраструктуре, использованной для обучения Grok 2, широко не раскрываются, но мы можем предположить, что он использовал значительно менее мощный кластер, чем Grok 3. Тем не менее, Grok 2 был предварительно обучен на мощных, хотя пока и не революционных, вычислительных ресурсах.

Таким компаниям, как xAI, нужны такие системы, как Colossus, чтобы не отставать от конкурентов, таких как OpenAI

Thumbnail: OpenAIOpenAI — американская научно-исследовательская организация, занимающаяся разработками в области искусственного интеллекта. В состав OpenAI входят зарегистрированная в штате Делавэр некоммерческая организация OpenAI, Inc и её дочерняя коммерческая компания OpenAI Global, LLC. OpenAI ставит перед собой цель разработать «безопасный и полезный» сильный искусственный интеллект, который организация определяет как «высокоавтономные системы, превосходящие человека в выполнении наиболее экономически ценной работы». На пути к этой цели организация создала несколько больших языковых моделей, в том числе GPT-4 и ChatGPT, а также моделей для генерации изображений, как DALL-E; в прошлом она публиковала модели с открытым исходным кодом. Некоммерческая организация OpenAI была основана в декабре 2015 года; её сопредседателями стали Сэм Олтмен и Илон Маск. Википедия

Читайте также:OpenAI становится коммерческой компанией, чтобы собрать больше денег на фоне убытковИлон Маск судится с OpenAI из-за коммерциализацииРуководители OpenAI размышляли о приобретении Cerebras в 2017 годуOpenAI разрабатывает свой первый чип ИИ в сотрудничестве с Broadcom и TSMCOpenAI, как сообщается, создает собственные чипы ИИ, поскольку она сотрудничает с AMD

, Google DeepMind и Anthropic. Возможность предварительной подготовки быстрее и в большем масштабе позволяет быстрее развертывать передовые модели, такие как LLM, такие как Grok 3 или GPT-4, которые содержат сотни миллиардов параметров. Обучение этих моделей включает триллионы операций с плавающей точкой. Вот почему Colossus будет расширен до 200 000 графических процессоров H100 и H200 в ближайшие месяцы, чтобы Grok Next был предварительно обучен на еще более колоссальной системе.

Примечательно, что xAI планирует со временем развернуть суперкомпьютер, работающий на более чем миллионе графических процессоров. Эта версия Colossus будет использоваться для обучения LLM, которые, вероятно, будут содержать триллионы параметров и будут намного точнее, чем Grok 3 или GPT-4o. Однако, в дополнение к большему количеству параметров, новые модели могут обладать более продвинутыми рассуждениями, что приближает их к общему искусственному интеллекту, что является конечной целью таких компаний, как xAI и OpenAI.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

Поддерживаю. А еще если брать в разрезе Илон Маск и безопасность данных, то вообще смешно. Особенно для жителей РФ)О конфиденциальности можно забыть
  • Анон
1c пох на ваши операции, количество ядер и прочее. Умудрились написать ядро четко привязанное к Мгц. Единственный в мире продукт для 1го ядра.
  • Анон
Указан неверный диаметр вентиляторов, не 80 мм, а 100 мм. И чип не 103, а 102.
  • Анон
С прошлым обновлением как раз и появилась эта ошибка. А новое как и написано не дают скачать.
  • Анон
При включении 3D Turbo Mode у вас максимум будет доступно 8 ядер и 8 потоков всего. т.е. если у вас 16 ядерный на 32 потока то будет всего 8 ядер и 8 потоков! Странная оптимизация!
  • Анон
После скачивания вышел синий экран СУПЕР!
  • Анон
требуется указать магазин и purchase date без этого не регистрирует
  • Анон
Россия на них клала❤❤❤❤, будет называться Ладушка 2.0 )))
  • Анон
ДА у меня тоже неработает уже все Вы не знаете каким способом вернуть все обратно СПАСИ
  • Анон

Смотреть все