Thinking Machines Lab борется со случайностью в ответах ИИ

Лаборатория Thinking Machines Lab Миры Мурати, получившая финансирование в размере 2 миллиардов долларов (~160 миллиардов рублей) и собравшая команду из бывших исследователей OpenAI, раскрыла детали одного из своих проектов. В блоге, опубликованном в среду, лаборатория представила исследование, посвящённое созданию ИИ-моделей с воспроизводимыми ответами.

Запись под названием «Победа над недетерминизмом в выводе больших языковых моделей» пытается выявить коренную причину случайности в ответах моделей ИИ. Например, если несколько раз задать ChatGPT один и тот же вопрос, можно получить совершенно разные ответы. В сообществе ИИ это принято как данность — современные модели считаются недетерминированными системами, — но в Thinking Machines Lab видят в этом решаемую проблему.

Автор поста, исследователь лаборатории Хорас Хи, утверждает, что основная причина случайности кроется в том, как GPU-ядрышки — небольшие программы, работающие внутри чипов Nvidia — соединяются в процессе обработки запросов (то, что происходит после нажатия Enter в ChatGPT). Он предполагает, что, тщательно контролируя этот уровень оркестровки, можно сделать модели ИИ более детерминированными.

Помимо создания более надёжных ответов для предприятий и учёных, Хи отмечает, что возможность генерации воспроизводимых ответов может также улучшить обучение с подкреплением (RL). RL — это процесс поощрения модели за правильные ответы, но если ответы каждый раз немного отличаются, данные становятся «зашумлёнными». Создание более последовательных ответов может сделать весь процесс RL «более гладким». Ранее сообщалось, что Thinking Machines Lab планирует использовать RL для настройки ИИ-моделей под нужды бизнеса.

Мурати, бывший технический директор OpenAI, в июле заявила, что первый продукт лаборатории будет представлен в ближайшие месяцы и будет «полезен исследователям и стартапам, разрабатывающим собственные модели». Пока неясно, что это за продукт и будет ли он использовать методы из данного исследования для генерации более воспроизводимых ответов.

Лаборатория также заявила, что планирует регулярно публиковать посты, код и другую информацию о своих исследованиях, чтобы «принести пользу обществу, а также улучшить собственную исследовательскую культуру». Этот пост, первый в новой серии блога компании под названием «Коннекционизм», похоже, является частью этих усилий.

ИИ: Очень интересное направление! Если Thinking Machines Lab действительно сможет решить проблему недетерминированности ИИ, это станет серьёзным прорывом, особенно для задач, требующих точности и повторяемости — например, в науке или медицине. Любопытно, удастся ли им сохранить открытость, в отличие от OpenAI, которая со временем стала более закрытой.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии