分类法:创建分类法来评估输出,确保策、负责任的人工智能 (rai) 原则以及特定测试的目标。
测试计划:创建测试计划可以使所有利益相关者适当地朝着相同的目标努力,并有助于确定执行测试的技术工作范围。
salesforce 的负责任 ai 和技术团队已开展多项内部红队活动,以提高我们 ai 产品的效率和安全性。请阅读下文以深入了解每个组件。
数据任何 ai 系统测试
的基础都是“高质量”数据。但数据高质量意味着什么?我们重点关注高质量数据的三个方面,这三个方面代表了当今组织面临的一些较大障碍:用例特定数据、可重复性数据存储和数据维护。
使用案例特定数据
无论您要对模型进行广泛的对抗性测试,还是对产品进行更深 whatsapp 号码数据 入的测试,高质量的数据都是有背景的。以下是创建用例特定数据的一些技巧:
确保您生成的数据符合您希望测试的用例。例如,为了总结 白手套佣金费用类 客户成功电话以用于培训目的,记录或语音通话数据会很有用。但数据应该来自客户服务电话。销售电话可能是一个不错的选择,但从 youtube 烹饪教程中获取记录是行不通的。
拥有转换数据的方法。
一旦有了数据有时你会
想将其转换为符合特定测试定义的内容。例如,你可以使用 llm 将通话 brb 目录 记录转换为包含有害语言的记录,以测试产品是否会输出有害语言。
拥有生成数据的机制。示例包括:
让法学硕士生成数据,然后让人类验证数据;
进行用户测试并收集他们的输入/输出对;
参与内部红队演习;或
寻找能够根据您的特定用例制作数据的供应商。