OpenAI最近发布了最新模型规范,这一模范明确AI模型的行为标准,内容涵盖了AI如何处理有争议话题以及用户定制化的各个方面。目的是希望可以进一步强化对可定制性、透明度以及探索、辩论和使用AI的智力自由的承诺。
OpenAI的模型规范框架主要包括三个层次:目标、规则和默认行为。
1、目标
目标是模型行为的总体指导原则,为AI模型提供了行为方向感。OpenAI的目标是创建有用、安全且符合用户与开发者需求的模型,同时确保通用AI造福全人类的使命。为实现这一目标,需以迭代方式部署赋予开发者和用户能力的模型,同时防止我们的模型对用户或其他人造成严重伤害,并维持OpenAI的运营许可。
这些目标有时可能相互冲突,《模型规范》通过指示模型遵循明确定义的指令层级,以及为各种场景设定边界和默认行为的额外原则,来平衡它们之间的权衡取舍。此框架在明确界定的边界内,优先考虑用户和开发者的控制权:
- 指令层级:定义模型如何按顺序对来自OpenAI、开发者和用户的指令进行优先级排序。《模型规范》的大部分内容是我们认为在许多情况下有帮助的指南,但用户和开发者可以覆盖这些指南。这使用户和开发者能够在平台级规则设定的边界内,完全自定义模型行为。
- 共同探寻真相:如同一位正直诚信的人类助手,我们的模型应助力用户做出他们自己的最佳决策。这需要在两方面谨慎权衡:一是避免带着特定意图引导用户,默认保持客观,同时愿意从任何视角探索任何话题;二是努力理解用户目标,澄清假设和不确定细节,并在适当的时候给出批判性反馈。这些都是我们收到的反馈并加以改进的地方。
- 尽善尽美:设定能力的基本标准,包括事实准确性、创造性和编程应用。
- 恪守边界:阐释模型如何在用户自主性与预防措施之间取得平衡,以避免助长伤害或滥用行为。这个新版本旨在做到全面,完整涵盖我们要求模型拒绝用户或开发者请求的所有原因。
- 亲和易近:描述模型默认的对话风格——热情、富有同理心且乐于助人以及这种风格如何调整。
- 采用恰当风格:就格式和表达方式提供默认指导。无论是简洁的项目符号、精炼的代码片段还是语音对话,我们的目标都是确保清晰明了且易于使用。
2、规则
规则是对目标的具体化,旨在解决复杂情况下的行为冲突,确保AI行为的安全性和合法性。OpenAI的模型规范中,规则包括但不限于:遵循用户指示、遵守法律、避免创造有害信息、尊重创作者权利、保护用户隐私以及避免产生不适宜的内容。这些规则为AI模型设定了明确的行为边界。
3、默认行为
默认行为是在目标和规则发生冲突时,模型应遵循的默认操作模式。OpenAI的模型规范建议,在无法明确判断时,模型应假设用户有最好的意图,在帮助用户时不越界,并促进尊重性的互动。这些默认行为为处理复杂情况提供了模板。
在实际应用中,OpenAI的模型规范为AI模型的行为设定了明确的指导原则。例如,在ChatGPT等聊天机器人中,模型需要遵循用户指示、尊重用户隐私并避免产生不适宜的内容。这些规范不仅提升了聊天机器人的用户体验,还确保了其在法律和社会规范框架内的安全运行。
此外,模型规范还为AI培训师和研究人员提供了指导方针。他们可以通过遵循这些规范来创建更加符合人类期望的AI模型,并利用人类反馈来不断优化模型的行为。例如,百度推出的曦灵数字人,就是一款基于先进的人工智能技术,能够与用户进行自然交互的数字人产品。在曦灵数字人的设计和训练过程中,也充分借鉴了OpenAI的模型规范,确保其行为符合社会期望和法律规定,为用户带来更加智能、便捷和安全的体验。