OpenAI представила новые модели GPT-5 Pro, Sora 2 и удешевленный голосовой ИИ для разработчиков

Компания OpenAI анонсировала обновления для своего API в рамках мероприятия Dev Day, представив свою новейшую языковую модель GPT-5 Pro, новую модель для генерации видео Sora 2 и более компактную и дешёвую голосовую модель.

Эти обновления стали частью серии объявлений, направленных на привлечение разработчиков в экосистему OpenAI, включая запуск инструмента для создания агентов и возможность создавать приложения прямо в ChatGPT.

Добавление GPT-5 Pro может заинтересовать разработчиков, создающих приложения для финансового, юридического и медицинского секторов — отраслей, которым требуется «высокая точность и глубина анализа», как отметил генеральный директор OpenAI Сэм Альтман.

Альтман также подчеркнул, что голосовые возможности будут играть ключевую роль в будущем, поскольку они быстро становятся одним из основных способов взаимодействия людей с ИИ. С этой целью OpenAI запускает «gpt-realtime mini» — более компактную и дешёвую голосовую модель в API, которая поддерживает потоковое взаимодействие с низкой задержкой для аудио и речи. Новая модель на 70% дешевле, чем предыдущая продвинутая голосовая модель OpenAI, но обещает «такое же качество голоса и выразительность».

Наконец, создатели, вовлечённые в экосистему разработчиков OpenAI, теперь могут получить доступ к Sora 2 в режиме предварительного просмотра через API. OpenAI выпустила Sora 2, свой новейший генератор аудио и видео, на прошлой неделе вместе с приложением Sora — конкурентом TikTok, наполненным короткими видео, созданными ИИ. Приложение Sora позволяет пользователям генерировать видео с собой, друзьями или чем угодно на основе текстового описания и делиться ими через ленту с алгоритмической подачей в стиле TikTok.

«[Разработчики] теперь имеют доступ к той же модели, которая обеспечивает потрясающие видеовыходы Sora 2, прямо в вашем собственном приложении», — заявил Альтман.

Sora 2 развивает идеи предыдущего поколения, предлагая более реалистичные, физически согласованные сцены с синхронизированным звуком и расширенным творческим контролем — от детальных указаний по камере до стилизованной графики.

«Например, вы можете взять вид с iPhone и попросить Sora расширить его до широкого кинематографического плана», — сказал Альтман. — «Но одна из самых захватывающих вещей, над которыми мы работали, — это то, насколько хорошо эта новая модель сочетает звук с визуальным рядом, и это не только речь, но и богатые звуковые ландшафты, фоновый звук, синхронизированные эффекты, которые основаны на том, что вы видите».

Sora 2 позиционируется как инструмент для разработки концепций, будь то визуальная отправная точка для рекламы, основанная на общем настроении продукта, или дизайнер Mattel, превращающий набросок в концепт игрушки — пример, который привёл Альтман на Dev Day, проливающий свет на сделку OpenAI с создателем Barbie по внедрению генеративного ИИ в процесс создания игрушек.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии