微比恩 > 文章栏目 > 文章正文

微软发布 ASSERT 开源框架:让开发者更高效地评测 AI 智能体和应用行为

IT之家2026-06-03 03:10:43
分享链接二维码
微软发布 ASSERT 开源框架:让开发者更高效地评测 AI 智能体和应用行为图片地址:https://img.ithome.com/newsuploadfiles/2026/6/24d9dc2e-349f-40db-9e98-4324248b013c.png?x-bce-process=image/format,f_auto
IT之家 6 月 3 日消息,微软今日宣布推出开源框架 ASSERT(Adaptive Spec-driven Scoring for Evaluation and Regression Testing,自适应规范驱动评分),旨在将自然语言写成的行为规范直接转换为可执行的评估流程。据介绍,ASSERT 能够从产品需求、政策文件或系统提示等文本出发,自动生成测试场景、数据集、评估指标和计分卡,并针对目标模型、应用或智能体运行测试。该框架建立在这样一个前提之上:行为规范本身应当成为评估的核心输入,而非仅仅作为背景参考。ASSERT 将这一过程系统化为四个阶段:首先,将宽泛的行为描述细化为明确的概念规范,进而转换为可编辑的许可与不许可行为分类体系;随后,基于开发者指定的维度(如任务类型、角色、工具可用性等)生成分层测试用例,涵盖单轮提示、多轮场景以及善意交互和对抗性探测;接着,对目标系统运行这些用例并记录完整轨迹,包括工具调用、中间决  阅读原文