Microsoft представила ASSERT — ИИ-инструмент для тестирования поведения моделей по текстовому описанию

45 минут назад / Технологии → Новости / Технологии

Исследователи и лаборатории в области ИИ добились значительных успехов в оценке моделей искусственного интеллекта по таким параметрам, как безопасность, соответствие требованиям, угодничество и согласованность. Однако, похоже, компании и разработчики сталкиваются с новой, специфической потребностью: гарантировать, что их ИИ-система ведет себя так, как задумано для конкретного продукта или услуги.

Стремясь упростить этот процесс тестирования, Microsoft во вторник представила ASSERT (Adaptive Spec-driven Scoring for Evaluation and Regression Testing — адаптивная оценка на основе спецификаций для тестирования и регрессионного анализа).

Как заявляет Microsoft, эта открытая платформа упрощает оценку специфичного для приложения поведения ИИ, используя искусственный интеллект для преобразования высокоуровневых описаний целей, политик или желаемого поведения на естественном языке в тщательные, оцениваемые тесты, которые можно исследовать.

ASSERT берет описания ожидаемого поведения и политик ИИ-модели на простом языке, преобразует их в структурированный набор приемлемых и неприемлемых действий, генерирует проблемные сценарии и тестовые примеры, запускает их для целевой системы и оценивает результаты. Инструмент также может записывать пути, которые проходит ИИ-система, включая промежуточные действия и вызовы инструментов, чтобы разработчики могли видеть, где происходят сбои.

Разработчики могут предоставлять контекст системы, инструменты и ограничения, если они хотят дополнительно настроить охват оценок.

Например, разработчик может указать, что ИИ-агент для исследования документов не должен отправлять электронные письма людям за пределами компании, ограничивать доступ к конфиденциальной информации только для руководителей высшего звена и предоставлять краткие сводки с учетом предыдущего контекста. ASSERT будет использовать эти правила для генерации тестовых примеров, которые проверяют, соблюдает ли система эти правила на постоянной основе.

Источник изображения: Microsoft

По словам Microsoft, этот инструмент заполняет пробел, который не могут закрыть более общие оценки, когда ИИ-модели должны вести себя определенным образом, обусловленным контекстом, политиками и инструментами конкретного приложения или продукта.

«Одна из вещей, которые мы усвоили, — это то, что оценки абсолютно критически важны для принятия правильных решений, — сказала Сара Берд, главный директор по продуктам ответственного ИИ в Microsoft. — Потому что, если вы не понимаете поведение ИИ-системы, очень трудно понять, соответствует ли она стандартам вашей организации [...] Мы обнаружили, что если вы действительно хотите иметь надежную систему, вам следует оценивать гораздо больше аспектов, специфичных для конкретного приложения».

Берд отметила, что ASSERT можно использовать для оценки систем как на этапе их создания, так и после развертывания, а также для непрерывного мониторинга.

Релиз инструмента происходит на фоне постепенного, но широкого сдвига в индустрии ИИ. По мере того как модели становятся более мощными, исследователи сосредотачиваются на повторяемом тестировании и регрессионных проверках. Такие проекты, как HELM от Стэнфорда, AILuminate от MLCommons и оценочные группы вроде METR, внедряют бенчмарки для измерения поведения моделей в различных условиях.