OpenAI выпускает семейство моделей GPT-4.1 с обширным контекстом и улучшенной производительностью

Вчера OpenAI

Thumbnail: OpenAIOpenAI — американская научно-исследовательская организация, занимающаяся разработками в области искусственного интеллекта. В состав OpenAI входят зарегистрированная в штате Делавэр некоммерческая организация OpenAI, Inc и её дочерняя коммерческая компания OpenAI Global, LLC. OpenAI ставит перед собой цель разработать «безопасный и полезный» сильный искусственный интеллект, который организация определяет как «высокоавтономные системы, превосходящие человека в выполнении наиболее экономически ценной работы». На пути к этой цели организация создала несколько больших языковых моделей, в том числе GPT-4 и ChatGPT, а также моделей для генерации изображений, как DALL-E; в прошлом она публиковала модели с открытым исходным кодом. Некоммерческая организация OpenAI была основана в декабре 2015 года; её сопредседателями стали Сэм Олтмен и Илон Маск. Википедия

Читайте также:OpenAI может купить стартап io Products за $500 млнИлон Маск против коммерциализации OpenAIOpenAI не хватает мощностей для GPT-4.5OpenAI и Broadcom планируют выпустить образцы специализированных чипов ИИ в этом годуГруппа инвесторов во главе с Илоном Маском делает ставку на OpenAI в размере 97,4 млрд долларов

представила новое семейство моделей GPT-4.1, в которое входят GPT-4.1, GPT-4.1 mini и GPT-4.1 nano. Эти модели обещают значительно улучшенное кодирование, следование инструкциям и понимание длинного контекста по сравнению с более ранними версиями, такими как GPT-4o. Все три поддерживают до одного миллиона токенов контекста, поэтому они могут обрабатывать гораздо большие документы, кодовые базы или даже часовые видеотрансляции. В тестах на кодирование GPT-4.1 набрала 54,6% на бенчмарке SWE-bench Verified, что на 21,4 балла больше, чем GPT-4o. Это делает ее одной из самых сильных моделей для реальных задач по разработке программного обеспечения. Она лучше исследует репозитории кода, создает исправления, которые фактически компилируются и проходят тесты, и следует форматам различий без дополнительных правок. Такие области, как следование инструкциям, также получили поддержку. В тесте Scale MultiChallenge GPT-4.1 набрал 38,3%, что на 10,5 баллов больше, чем у GPT-4o. Это означает, что он может более надежно придерживаться многошаговых подсказок и форматировать свои ответы так, как вы просите.

Навыки работы с длинным контекстом моделей выделяются на тесте Video-MME, где GPT-4.1 набрала 72,0% в категории «длинные, без субтитров», что на 6,7 балла выше, чем GPT-4o. Благодаря окну в один миллион токенов GPT-4.1 может собирать информацию, распределенную по огромным объемам входных данных, будь то разрозненный текст в документе или ключевые моменты в видео. OpenAI утверждает, что эти достижения достигаются благодаря тесному сотрудничеству с разработчиками, настраивающими модели для важных задач, одновременно сокращая расходы и задержку. Мини-сокращения GPT-4.1 обходятся в 83% и почти вдвое сокращают время отклика по сравнению с GPT-4o. GPT-4.1 nano еще быстрее и дешевле, что делает ее идеальной для классификации или автодополнения. Все три модели теперь доступны через API OpenAI. Изначально они не будут отображаться непосредственно в ChatGPT, хотя многие из их улучшений уже вошли в последний чат-бот GPT-4o. Разработчики, использующие GPT-4.5 Preview, должны запланировать переход к 14 июля 2025 года, когда эта версия будет упразднена. В то время как o3-mini остается самой мощной думающей моделью, не думающее семейство GPT-4.1 закрывает разрыв, обеспечивая более быстрое время отклика.

Источник: OpenAI

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

Всё в порядке с физикой: источник может быть меньше четверти длины волны. Даже одиночный ион в ионной ловушке может излучать видимый свет (а размер меньше 0.2нм).
  • Анон
Можно делать смартфоны и планшеты на этом процессоре и наконец то использовать полноценную windows. Это отличная замена процессорам arm
  • Анон
Странно почему не 50 долларов.
  • Анон
Понимаю мощь производительность и все дела, но как черт возьми тепло отделять от камня если его прям нагрузить
  • Анон
Не предвзятость это - "Интересно, что Arc B580 проигрывает RTX 4060 в OpenCL" - где разница на невероятных 3,5 %, "но реабилитируется с НЕЗНАЧИТЕЛЬНЫМ 6%-ным преимуществом в Vulkan.". Не...
  • Анон
И теперь нельзя отключить авто обновление!!! Это жесть
  • Анон
Не знаю, я купил Cougar850 80Gold за 10К₽ и нормально
  • Анон
После всех роликов я одно понял у этой игры которую выпустят 20 мая у неё большое будущее
  • Анон
Когда они в продаже появятся? Уже как бы конец февраля, а нигде нет..
  • Анон

Смотреть все