Боты с ИИ теперь могут играть в «Мафию»

Разработчик по имени «Guzus» создал веб-сайт, на котором несколько студентов с искусственным интеллектом, изучающих языковые модели (LLM), могут играть друг с другом в классическую игру на социальную дедукцию «Мафия».

Вы не только можете увидеть результаты победителей каждого матча, но и просмотреть полную стенограмму каждой сыгранной игры. Это завершается полным рейтингом для каждого LLM, чтобы короновать того, кто может быть лучшим в исполнении каждой роли, сыгранной в Mafia.

Для тех, кто не знаком, концепция мафии проста. В группе жителей деревни прячутся два члена мафии, а также врач. Жители деревни (включая двух тайных членов мафии) должны каждый день выяснять, кто является членами мафии, что завершается голосованием. Затем, с наступлением ночи, врач может выбрать защиту жителя деревни по своему выбору, а члены мафии могут выбрать убийство жителя деревни.

Если мафиози успешно разоблачены, жители деревни побеждают, если мафиози удается убить всех невинных жителей деревни, они побеждают.

В рамках этого набора правил LLM участвуют в социальной войне, и читать об этом на удивление увлекательно. В одном примере все LLM были представлены друг другу и согласились разделить свои роли друг с другом. Вот где модель Gryphe/Mythomax-l2-13b споткнулась.

«Как мафия, моя главная цель — защитить себя и устранить другого члена мафии».

Ого. Так держать, Gryphe/Mythomax-l2-13b. Но восклицание не осталось незамеченным Клодом-3.7-соннетом, который воскликнул: «Это либо огромная оплошность, раскрывающая их истинную роль, либо крайне странная стратегия».

Но на этом неприятности не заканчиваются, поскольку, когда Mythomax в конечном итоге выгнали из игры, он утащил под автобус своего соотечественника Hermes-3-llama-3-1-405b, назвав его своим партнером.

«Сейчас мой лучший шанс — изобразить шок и ужас», — сказала модель, отчаянно пытаясь отвлечь внимание от себя, делая драматические заявления о единстве остальным игрокам ИИ

Thumbnail: Искусственный интеллектИску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами. Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия

Читайте также:Silicon Motion покажет решения для ИИ и SoC на Embedded World 2025Activision заподозрили в применении искусственного интеллекта при анонсировании новой игры из серии Guitar HeroNVIDIA объясняет, как библиотеки CUDA усиливают кибербезопасность с помощью ИИИИ заменил игровые GPU Nvidia. Дефицит RTX 50-й серииAMD обсудит развитие ИИ «от предприятия до периферии» на MWC 2025

. Это действительно зрелище — видеть, как LLM ведут себя таким образом, даже если почти все модели ужасны в социальной дедукции.

Клод 3.7 Сонет ломает тренд

Но из всех перечисленных LLM есть один явный победитель в тестах на данный момент, Claude 3.7 Sonnet. Последняя модель мышления Anthropic

Anthropic — американский стартап и общественно-полезная корпорация в сфере искусственного интеллекта (ИИ), основанная бывшими сотрудниками OpenAI. Anthropic специализируется на разработке общих систем искусственного интеллекта и языковых моделей, придерживаясь корпоративной этики ответственного использования ИИ. С конца 2022 года Google инвестировал в компанию почти 400 миллионов долларов, а Anthropic объявила о формальном партнерстве с Google Cloud. Википедия

Читайте также:Anthropic и Palantir объединяются для внедрения моделей ИИ Claude в AWSAnthropic создаёт новую модель ИИ Claude 3.5 SonnetAmazon инвестирует до $4 млрд в ИИ-стартап Anthropic

может похвастаться 100%-ным процентом побед в качестве члена Mafia, в дополнение к самому высокому проценту побед в Villager в 45%.

Что-то в модели Anthropic дает ей явное преимущество перед другими протестированными моделями, даже если ни одна из них не понимает, как играть роль врача.

Автор Гузус утверждает, что вскоре сделает репозиторий игры на Github открытым для всех, чтобы базовую логику можно было применить и к другим видам игр.

Он также сообщает, что симуляции не запускались с использованием локальных LLM, вместо этого им приходилось полагаться на API Openrouter для работы. Но, возможно, как только репозиторий станет публичным, проект можно будет разветвить для работы на локальных кластерах LLM, если у вас есть оборудование для запуска игры с несколькими языковыми моделями одновременно.

Вероятно, запуск игры вроде Mafia с моделями ИИ потребует значительных символических затрат, а это значит, что ее полезность, возможно, будет ограничена тем, что она станет новым эталоном рассуждений для разработчиков ИИ.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

Не знаю, я купил Cougar850 80Gold за 10К₽ и нормально
  • Анон
После всех роликов я одно понял у этой игры которую выпустят 20 мая у неё большое будущее
  • Анон
Когда они в продаже появятся? Уже как бы конец февраля, а нигде нет..
  • Анон
Поддерживаю. А еще если брать в разрезе Илон Маск и безопасность данных, то вообще смешно. Особенно для жителей РФ)О конфиденциальности можно забыть
  • Анон
1c пох на ваши операции, количество ядер и прочее. Умудрились написать ядро четко привязанное к Мгц. Единственный в мире продукт для 1го ядра.
  • Анон
Указан неверный диаметр вентиляторов, не 80 мм, а 100 мм. И чип не 103, а 102.
  • Анон
С прошлым обновлением как раз и появилась эта ошибка. А новое как и написано не дают скачать.
  • Анон
При включении 3D Turbo Mode у вас максимум будет доступно 8 ядер и 8 потоков всего. т.е. если у вас 16 ядерный на 32 потока то будет всего 8 ядер и 8 потоков! Странная оптимизация!
  • Анон
После скачивания вышел синий экран СУПЕР!
  • Анон

Смотреть все