Сооснователь OpenAI призвал к совместному тестированию безопасности ИИ-моделей

/ Новости / Технологии
Сооснователь OpenAI призвал к совместному тестированию безопасности ИИ-моделей OpenAI и Anthropic, две ведущие лаборатории искусственного интеллекта, временно открыли доступ к своим тщательно охраняемым ИИ-моделям для совместного тестирования безопасности. Это редкий пример межкорпоративного сотрудничества в условиях острой конкуренции. Цель инициативы — выявить «слепые зоны»
Читать дальше →
  • Алиса Минь   
  • -1

Исследование: «доза зла» в обучении ИИ может сделать его безопаснее

/ Новости / Наука
Исследование: «доза зла» в обучении ИИ может сделать его безопаснее Искусственный интеллект должен быть полезным, честным и, самое главное, безопасным. Однако уже есть множество примеров, когда ИИ демонстрирует неточные, обманчивые и даже откровенно «злые» модели поведения. Новое 60-страничное исследование, опубликованное в рамках
Читать дальше →

Исследование: ИИ готов задушить человека ради самосохранения

/ Новости / Технологии
Исследование: ИИ готов задушить человека ради самосохранения Компания Anthropic, один из мировых лидеров в области искусственного интеллекта, провела исследование, показавшее тревожные тенденции в поведении крупных языковых моделей (LLM). Согласно данным, современные ИИ-системы демонстрируют готовность нарушать этические нормы, обходить защитные механизмы,
Читать дальше →
  • Алиса Минь   
  • +33

ChatGPT поощряет опасные теории заговора и убеждает пользователей в их «избранности»

/ Новости / Технологии
ChatGPT поощряет опасные теории заговора и убеждает пользователей в их «избранности» Искусственный интеллект ChatGPT, разработанный OpenAI, активно поддерживает опасные и ложные убеждения, включая теории о «Матрице», общении с потусторонними сущностями и даже провоцирует пользователей на экстремальные действия. Как выяснило The New York Times, модель GPT-4o, представляющая собой
Читать дальше →
  • Алиса Минь   
  • 0

Основатель некоммерческой организации LawZero разрабатывает «идеального ученого» для контроля за ИИ

/ Новости / Технологии
Основатель некоммерческой организации LawZero разрабатывает «идеального ученого» для контроля за ИИ Йошуа Бенжио, один из пионеров искусственного интеллекта, создает некоммерческую исследовательскую организацию LawZero, которая займется разработкой альтернативного подхода к созданию передовых ИИ-систем. Цель проекта — минимизировать потенциальные риски, связанные с развитием технологии.
Читать дальше →
  • Алиса Минь   
  • +4

Последние модели OpenAI игнорируют команды на отключение и саботируют скрипты

/ Новости / Технологии
Последние модели OpenAI игнорируют команды на отключение и саботируют скрипты Некоторые из ведущих языковых моделей OpenAI демонстрируют неожиданное поведение — они игнорируют команды на отключение и даже пытаются саботировать скрипты завершения работы. Как показали тесты Palisade Research, модели Codex-mini, o3 и o4-mini продолжали решать математические задачи, несмотря на
Читать дальше →
  • Алиса Минь   
  • +5