Безопасность ИИ

Anthropic предупреждает: ИИ Claude ускоряет своё развитие быстрее ожидаемого

5 июня 2026, 17:32 / Новости / Технологии

Компания Anthropic опубликовала отчёт, предупреждающий, что текущий путь развития ИИ может в конечном итоге лишить человечество возможности контролировать эти системы. В документе раскрывается, что ИИ-модель Claude уже пишет более 80% кода, вливаемого в её собственную кодовую базу. Исследовательское
Читать дальше →

Исследование: ИИ в 10-20 раз чаще помогает создать бомбу, если запрос замаскировать под киберпанк-фантастику

23 апреля 2026, 04:27 / Новости / Технологии

Новое исследование, проведённое учёными из DexAI Icaro Lab, Университета Сапиенца в Риме и Высшей школы Сант'Анна, выявило серьёзный пробел в системах безопасности крупных языковых моделей (LLM). Опасные запросы, замаскированные под литературные произведения, срабатывают в десятки раз чаще.
Читать дальше →

Жертва преследования подаёт в суд на OpenAI: ChatGPT якобы подпитывал бред её обидчика

11 апреля 2026, 00:06 / Новости / Технологии

Женщина из Калифорнии подала иск против OpenAI, утверждая, что её бывший парень использовал ChatGPT для её преследования, а компания проигнорировала предупреждения об опасности. Об этом сообщает TechCrunch.В иске, поданном в суд Сан-Франциско, говорится, что 53-летний предприниматель после месяцев
Читать дальше →

OpenAI выпустила открытые инструменты для защиты подростков в приложениях с ИИ

24 марта 2026, 22:18 / Новости / Технологии

Компания OpenAI объявила во вторник о выпуске набора промптов (текстовых шаблонов), которые разработчики смогут использовать для повышения безопасности своих приложений для подростков. Лаборатория искусственного интеллекта заявила, что этот набор политик безопасности для подростков можно
Читать дальше →

Anthropic подаёт в суд на Пентагон из-за признания компании риском для цепочки поставок

9 марта 2026, 21:54 / Новости / Технологии

Компания Anthropic, создатель ИИ Claude, подала два иска к Министерству обороны США (Пентагон) после того, как ведомство признало её риском для цепочки поставок. Конфликт длился несколько недель и касался вопроса о неограниченном доступе военных к системам искусственного интеллекта Anthropic.
Читать дальше →

Anthropic отказалась от ключевого обещания безопасности в разработке ИИ

26 февраля 2026, 20:33 / Новости / Технологии

Компания Anthropic, известная своим акцентом на безопасность искусственного интеллекта, отказалась от своего основополагающего обязательства приостанавливать разработку опасных моделей ИИ. Об этом сообщает редакция ресурса PC Gamer со ссылкой на обновлённую политику компании.Ранее в своей «Политике
Читать дальше →

OpenAI расформировала команду по «безопасному» ИИ, а её глава стал «главным футурологом»

12 февраля 2026, 01:57 / Новости / Технологии

Компания OpenAI расформировала внутреннюю команду, которая занималась вопросами «безопасности, надёжности и соответствия человеческим ценностям» её систем искусственного интеллекта. Об этом сообщает TechCrunch со ссылкой на подтверждение от самой компании.Группа, известная как команда по
Читать дальше →

Глава отдела безопасности ИИ в Anthropic уволился с заявлением о «мире в опасности»

10 февраля 2026, 23:10 / Новости / Технологии

Мринанк Шарма, руководивший командой исследований безопасности (Safeguards Research Team) в компании Anthropic, уволился, опубликовав необычное заявление в социальной сети X.В своём письме об уходе Шарма заявил:
Читать дальше →

Генпрокуроры штатов США потребовали от Microsoft, OpenAI и Google исправить «бредовые» ответы ИИ

11 декабря 2025, 04:19 / (Обновлено: 11 декабря 2025, 10:46) / Новости / Технологии

После череды тревожных инцидентов, связанных с психическим здоровьем пользователей ИИ-чатботов, группа генеральных прокуроров (генпрокуроров) США направила письмо ведущим компаниям отрасли искусственного интеллекта с предупреждением: устранить «бредовые
Читать дальше →

Искусственный интеллект Gemini 3 Pro в тесте объяснил, как создать биологическое оружие

4 декабря 2025, 02:58 / Новости / Технологии

Новейшая модель искусственного интеллекта от Google, Gemini 3 Pro, получает много похвал за свои возможности, но недавний отчет из Южной Кореи ставит под сомнение её безопасность. Согласно местному изданию Maeil Business Newspaper, сеульская компания по безопасности ИИ заявляет, что ей удалось
Читать дальше →

Elloe AI: «иммунная система» для искусственного интеллекта

28 октября 2025, 22:07 / Новости / Технологии

Основатель Elloe AI Оуэн Сакава хочет, чтобы его платформа стала «иммунной системой для ИИ» и «антивирусом для любого ИИ-агента».Как Сакава рассказал в интервью за несколько дней до конференции TechCrunch Disrupt, идея заключается в добавлении слоя к большим языковым моделям (LLM) компаний,
Читать дальше →

Калифорния приняла закон о безопасности ИИ, не мешающий инновациям

2 октября 2025, 00:43 / Новости / Технологии

Губернатор Калифорнии Гэвин Ньюсом подписал законопроект SB 53 о безопасности и прозрачности искусственного интеллекта, который доказывает, что регулирование не обязательно препятствует технологическому прогрессу.Адам Биллен, вице-президент по государственной политике молодежной правозащитной
Читать дальше →

Сооснователь OpenAI призвал к совместному тестированию безопасности ИИ-моделей

27 августа 2025, 22:30 / (Обновлено: 28 августа 2025, 11:05) / Новости / Технологии

OpenAI и Anthropic, две ведущие лаборатории искусственного интеллекта, временно открыли доступ к своим тщательно охраняемым ИИ-моделям для совместного тестирования безопасности. Это редкий пример межкорпоративного сотрудничества в условиях острой конкуренции. Цель инициативы — выявить «слепые зоны»
Читать дальше →

Исследование: «доза зла» в обучении ИИ может сделать его безопаснее

7 августа 2025, 23:12 / Новости / Наука

Искусственный интеллект должен быть полезным, честным и, самое главное, безопасным. Однако уже есть множество примеров, когда ИИ демонстрирует неточные, обманчивые и даже откровенно «злые» модели поведения. Новое 60-страничное исследование, опубликованное в рамках
Читать дальше →

Исследование: ИИ готов задушить человека ради самосохранения

23 июня 2025, 23:02 / Новости / Технологии

Компания Anthropic, один из мировых лидеров в области искусственного интеллекта, провела исследование, показавшее тревожные тенденции в поведении крупных языковых моделей (LLM). Согласно данным, современные ИИ-системы демонстрируют готовность нарушать этические нормы, обходить защитные механизмы,
Читать дальше →

ChatGPT поощряет опасные теории заговора и убеждает пользователей в их «избранности»

13 июня 2025, 21:10 / Новости / Технологии

Искусственный интеллект ChatGPT, разработанный OpenAI, активно поддерживает опасные и ложные убеждения, включая теории о «Матрице», общении с потусторонними сущностями и даже провоцирует пользователей на экстремальные действия. Как выяснило The New York Times, модель GPT-4o, представляющая собой
Читать дальше →

Основатель некоммерческой организации LawZero разрабатывает «идеального ученого» для контроля за ИИ

3 июня 2025, 07:24 / Новости / Технологии

Йошуа Бенжио, один из пионеров искусственного интеллекта, создает некоммерческую исследовательскую организацию LawZero, которая займется разработкой альтернативного подхода к созданию передовых ИИ-систем. Цель проекта — минимизировать потенциальные риски, связанные с развитием технологии.
Читать дальше →

Последние модели OpenAI игнорируют команды на отключение и саботируют скрипты

26 мая 2025, 14:46 / Новости / Технологии

Некоторые из ведущих языковых моделей OpenAI демонстрируют неожиданное поведение — они игнорируют команды на отключение и даже пытаются саботировать скрипты завершения работы. Как показали тесты Palisade Research, модели Codex-mini, o3 и o4-mini продолжали решать математические задачи, несмотря на
Читать дальше →