Илон Маск предложил ИИ-дуэль по программированию, но получил отказ

Илон Маск предложил публичное соревнование по программированию между моделью Grok 5 от его компании xAI и бывшим руководителем исследований OpenAI Андреем Карпати, сравнив его с матчем 1997 года между Гарри Каспаровым и суперкомпьютером IBM Deep Blue. Карпати вежливо отказался, заявив, что предпочел бы сотрудничать с Grok, а не соревноваться против него.

Вызов прозвучал в ответ на фрагмент недавнего интервью Карпати для подкаста Dwarkesh Podcast, где он заявил, что до создания общего искусственного интеллекта (ИИ), вероятно, осталось около десяти лет, и охарактеризовал Grok 5 как отстающую от GPT-4 на несколько месяцев.

Маск, который ранее заявлял, что у Grok 5 есть 10%-ный и растущий шанс достичь уровня общего ИИ, воспринял это как приглашение к состязанию. «Согласен ли ты на ИИ-соревнование по программированию?» — написал он в X, напрямую обратившись к Карпати.

Ты делаешь много отличных замечаний, особенно насчёт того, что детям следует рано изучать инструменты физики. Согласен ли ты на ИИ-соревнование по программированию или любой другой вид состязания для Андрея против Grok 5, в стиле Каспаров против Deep Blue?

Карпати ответил, что его вклад в таком матче «будет стремиться к нулю», и подчеркнул, что рассматривает современные модели скорее как коллег, а не как противников.

Идея формального соревнования по программированию между моделью и человеком не так уж надумана. Ранее в этом году DeepMind заявила, что Gemini 2.5 решила 10 из 12 задач в условиях, аналогичных финалу чемпионата мира по программированию ICPC, что соответствует уровню золотого медалиста. И OpenAI, и DeepMind уже достигли идеального результата 12/12 на том же наборе тестов, используя GPT-4 и GPT-5. Эти задачи взяты из университетских алгоритмических соревнований, оцениваются как на корректность, так и на время выполнения, и запускаются в условиях строгих ограничений по ресурсам и времени.

Ранее в этом году польский программист обыграл специализированную модель OpenAI в 10-часовом очном финале на AtCoder World Tour Finals, что породило предположения, что это может быть последняя победа человека на высшем уровне. Тот конкурс был строго контролируемым и полностью прозрачным.

Если Маск хочет, чтобы Grok 5 воспринимали всерьёз в этом классе, ему придется подвергнуть её тем же условиям. Сравнение с Deep Blue работает только в том случае, если матч можно измерить. Это означает соревнования фиксированной длительности с использованием публичного набора задач, идентичный доступ к инструментам и вычислительным ресурсам, а также отсутствие внешних подсказок или помощи человека. Результаты должны быть оценены независимо и опубликованы в полном объеме.

Решение Карпати не участвовать отражает более широкий сдвиг в том, как специалисты по машинному обучению говорят о производительности. Вместо того чтобы устраивать очные поединки, многие теперь сосредоточены на том, насколько хорошо модели могут ускорить результат человека. Однако соревновательное программирование по-прежнему предлагает четкий и хорошо определенный эталон. И пока что Grok еще не опубликовала своих результатов.

Если xAI хочет продемонстрировать паритет или превосходство, формальное прохождение задач уровня ICPC стало бы очевидным местом для старта.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии