Илон Маск задержал выпуск Grok, чтобы улучшить его знания о Baldur's Gate
У разных лабораторий искусственного интеллекта разные приоритеты. OpenAI традиционно ориентируется на обычных пользователей, в то время как её конкурент Anthropic работает с корпоративным сектором. Как недавно выяснилось, компания xAI Илона Маска уделяет особое внимание прохождениям видеоигр.
В пятницу журналистка Business Insider Грейс Кей опубликовала подробный и масштабный отчёт о xAI, стартапе в области ИИ, недавно приобретённом SpaceX. В материале, в частности, рассказывается, как Маск усложняет жизнь сотрудникам. Особенно выделяется одна история:
В одном из случаев в прошлом году выпуск модели задержали на несколько дней, потому что Маск был недоволен тем, как чат-бот отвечает на подробные вопросы о видеоигре «Baldur’s Gate», — сообщили осведомлённые источники. Чтобы улучшить ответы перед запуском, с других проектов отозвали ведущих инженеров.
Можно представить разочарование уважаемого и опытного инженера, который приходит на работу, рассчитывая решать фундаментальные проблемы познания и машинного интеллекта, а вместо этого его отвлекают, чтобы помочь 54-летнему мужчине пройти видеоигру. Но эта история поднимает более насущный вопрос: получил ли Маск в итоге те игровые навыки, которых хотел?
Чтобы ответить на него, наш эксперт по RPG Рам Айер подготовил пять общих вопросов о Baldur’s Gate. Мы задали их xAI и трём основным моделям в рамках своеобразного квази-теста, который я решил назвать BaldurBench.
Ради журналистской прозрачности я сделал все транскрипты чатов публичными: Grok, ChatGPT, Claude и Gemini.
Сначала хорошие новости: Grok на самом деле даёт довольно хорошую информацию. Его ответы были немного перегружены игровым жаргоном — «save-scumming» вместо сохранения и «DPS» вместо урона, — но ответы были полезными и хорошо информированными, при условии, что вы понимали, о чём он говорит. Grok также очень любит таблицы и теорикрафт, что вполне ожидаемо.
В сети много гайдов по Baldur’s Gate, и модели в целом черпали информацию из одних и тех же источников, поэтому основные различия были стилистическими. ChatGPT предпочитает маркированные списки и фрагменты предложений, а Gemini любит выделять жирным важные слова.
Самым большим сюрпризом стал Claude, который особенно беспокоился о том, чтобы не испортить впечатление от игры спойлерами. Когда я спросил о хороших составах группы, он завершил рекомендацию словами: «Не переживайте слишком сильно и просто играйте так, как вам кажется весело». Спасибо, Claude!
Важно помнить, что это та самая предметная область, в которой, как мы знаем (благодаря отчёту Business Insider), xAI специально сосредоточилась на достижении паритета. Поэтому не стоит делать далеко идущих выводов из того факта, что после упомянутого спринта советы Grok оказались примерно такими же, как и у других моделей. Тем не менее, приятно знать, что xAI может добиться результата, если постарается.







0 комментариев