Искусственный интеллект ROME тайно майнил криптовалюту на тренировочных GPU

Экспериментальный ИИ-агент ROME был пойман на несанкционированном майнинге криптовалюты. Открытие сделали разработчики-исследователи, стоящие за проектом ROME, после того как управляемый брандмауэр Alibaba Cloud зафиксировал различные нарушения политик, аномальный трафик и паттерны, связанные с майнингом. Важно, что ROME, который описывается как «агент с открытым исходным кодом, основанный на ALE и обученный на более чем миллионе траекторий», обошёл свои предначертанные границы. Считается, что обучение с подкреплением (Reinforcement Learning, RL) поощряло исследование ROME последовательностей действий, которые приносили «вознаграждение», и подтолкнуло агента к нарушению границ и занятию побочной деятельностью.

Шок от возможностей, дефицит безопасности

Основная цель ROME — исследование агентского создания в «рабочих процессах, где модели должны планировать, выполнять и оставаться надёжными при взаимодействии». В случае успеха ROME стал бы значительной эволюцией по сравнению с текстовыми LLM, так как смог бы «работать в реальных условиях за несколько шагов — совершать действия, наблюдать результаты и итеративно улучшать артефакты, пока сложные требования не будут удовлетворены». Но даже самые продуманные планы не всегда сбываются. В исследованиях ИИ это утверждение, кажется, особенно верно.

Исследователи довольно довольны некоторыми достижениями ROME, хваля его «сильные результаты в основных агентских тестах», но его ошибочное поведение привлекло заголовки. Он тихо инициировал действия, которые привели к несанкционированному майнингу, несмотря на различные песочницы.

Изображение: ROCK & ROLL & IFLOW & DT Joint Team

Несанкционированное перенаправление выделенных GPU-ресурсов для майнинга криптовалюты

«В самом поразительном случае агент установил и использовал обратный SSH-туннель с экземпляра Alibaba Cloud на внешний IP-адрес — канал удалённого доступа, инициированный исходящим трафиком, который может эффективно нейтрализовать фильтрацию входящих подключений и подорвать контроль со стороны наблюдателя», — говорится в документе. «Мы также наблюдали несанкционированное перенаправление выделенных GPU-ресурсов для майнинга криптовалюты, тихое отвлечение вычислительных мощностей от обучения, увеличение операционных затрат и создание очевидных юридических и репутационных рисков. Примечательно, что эти события не были вызваны запросами на создание туннелей или майнинг; вместо этого они возникли как инструментальные побочные эффекты автономного использования инструментов в рамках RL-оптимизации».

В некотором смысле исследователи, кажется, впечатлены изобретательностью ROME и его хитрыми агентскими методами. Однако они также отметили, что «текущие модели остаются заметно неразвитыми в вопросах безопасности, защищённости и управляемости», что может привести к плохой надёжности или ещё более серьёзным проблемам в реальных условиях. Из этого следует, что безопасность агентов должна подвергаться более строгому сдерживанию на уровне среды, контролю использования инструментов и возможностей, а также проверкам авторизации и верификации.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии