OpenAI выпускает семейство моделей GPT-4.1 с обширным контекстом и улучшенной производительностью

15 апреля 2025, 20:07 / Технологии → Новости / Технологии

Вчера OpenAI

Thumbnail: OpenAI OpenAI — американская научно-исследовательская организация, занимающаяся разработками в области искусственного интеллекта. В состав OpenAI входят зарегистрированная в штате Делавэр некоммерческая организация OpenAI, Inc и её дочерняя коммерческая компания OpenAI Global, LLC. OpenAI ставит перед собой цель разработать «безопасный и полезный» сильный искусственный интеллект, который организация определяет как «высокоавтономные системы, превосходящие человека в выполнении наиболее экономически ценной работы». На пути к этой цели организация создала несколько больших языковых моделей, в том числе GPT-4 и ChatGPT, а также моделей для генерации изображений, как DALL-E; в прошлом она публиковала модели с открытым исходным кодом. Некоммерческая организация OpenAI была основана в декабре 2015 года; её сопредседателями стали Сэм Олтмен и Илон Маск. Википедия

представила новое семейство моделей GPT-4.1, в которое входят GPT-4.1, GPT-4.1 mini и GPT-4.1 nano. Эти модели обещают значительно улучшенное кодирование, следование инструкциям и понимание длинного контекста по сравнению с более ранними версиями, такими как GPT-4o. Все три поддерживают до одного миллиона токенов контекста, поэтому они могут обрабатывать гораздо большие документы, кодовые базы или даже часовые видеотрансляции. В тестах на кодирование GPT-4.1 набрала 54,6% на бенчмарке SWE-bench Verified, что на 21,4 балла больше, чем GPT-4o. Это делает ее одной из самых сильных моделей для реальных задач по разработке программного обеспечения. Она лучше исследует репозитории кода, создает исправления, которые фактически компилируются и проходят тесты, и следует форматам различий без дополнительных правок. Такие области, как следование инструкциям, также получили поддержку. В тесте Scale MultiChallenge GPT-4.1 набрал 38,3%, что на 10,5 баллов больше, чем у GPT-4o. Это означает, что он может более надежно придерживаться многошаговых подсказок и форматировать свои ответы так, как вы просите.

Навыки работы с длинным контекстом моделей выделяются на тесте Video-MME, где GPT-4.1 набрала 72,0% в категории «длинные, без субтитров», что на 6,7 балла выше, чем GPT-4o. Благодаря окну в один миллион токенов GPT-4.1 может собирать информацию, распределенную по огромным объемам входных данных, будь то разрозненный текст в документе или ключевые моменты в видео. OpenAI утверждает, что эти достижения достигаются благодаря тесному сотрудничеству с разработчиками, настраивающими модели для важных задач, одновременно сокращая расходы и задержку. Мини-сокращения GPT-4.1 обходятся в 83% и почти вдвое сокращают время отклика по сравнению с GPT-4o. GPT-4.1 nano еще быстрее и дешевле, что делает ее идеальной для классификации или автодополнения. Все три модели теперь доступны через API OpenAI. Изначально они не будут отображаться непосредственно в ChatGPT, хотя многие из их улучшений уже вошли в последний чат-бот GPT-4o. Разработчики, использующие GPT-4.5 Preview, должны запланировать переход к 14 июля 2025 года, когда эта версия будет упразднена. В то время как o3-mini остается самой мощной думающей моделью, не думающее семейство GPT-4.1 закрывает разрыв, обеспечивая более быстрое время отклика.

Источник: OpenAI

OpenAI выпускает семейство моделей GPT-4.1 с обширным контекстом и улучшенной производительностью

0 комментариев

Оставить комментарий

Все комментарии - Технологии