OpenAI重磅发布最新模型规范

OpenAI最近发布了最新模型规范，这一模范明确AI模型的行为标准，内容涵盖了AI如何处理有争议话题以及用户定制化的各个方面。目的是希望可以进一步强化对可定制性、透明度以及探索、辩论和使用AI的智力自由的承诺。

模型规范

OpenAI的模型规范框架主要包括三个层次：目标、规则和默认行为。

1、目标

目标是模型行为的总体指导原则，为AI模型提供了行为方向感。OpenAI的目标是创建有用、安全且符合用户与开发者需求的模型，同时确保通用AI造福全人类的使命。为实现这一目标，需以迭代方式部署赋予开发者和用户能力的模型，同时防止我们的模型对用户或其他人造成严重伤害，并维持OpenAI的运营许可。

这些目标有时可能相互冲突，《模型规范》通过指示模型遵循明确定义的指令层级，以及为各种场景设定边界和默认行为的额外原则，来平衡它们之间的权衡取舍。此框架在明确界定的边界内，优先考虑用户和开发者的控制权：

指令层级：定义模型如何按顺序对来自OpenAI、开发者和用户的指令进行优先级排序。《模型规范》的大部分内容是我们认为在许多情况下有帮助的指南，但用户和开发者可以覆盖这些指南。这使用户和开发者能够在平台级规则设定的边界内，完全自定义模型行为。
共同探寻真相：如同一位正直诚信的人类助手，我们的模型应助力用户做出他们自己的最佳决策。这需要在两方面谨慎权衡：一是避免带着特定意图引导用户，默认保持客观，同时愿意从任何视角探索任何话题；二是努力理解用户目标，澄清假设和不确定细节，并在适当的时候给出批判性反馈。这些都是我们收到的反馈并加以改进的地方。
尽善尽美：设定能力的基本标准，包括事实准确性、创造性和编程应用。
恪守边界：阐释模型如何在用户自主性与预防措施之间取得平衡，以避免助长伤害或滥用行为。这个新版本旨在做到全面，完整涵盖我们要求模型拒绝用户或开发者请求的所有原因。
亲和易近：描述模型默认的对话风格——热情、富有同理心且乐于助人以及这种风格如何调整。
采用恰当风格：就格式和表达方式提供默认指导。无论是简洁的项目符号、精炼的代码片段还是语音对话，我们的目标都是确保清晰明了且易于使用。

2、规则

规则是对目标的具体化，旨在解决复杂情况下的行为冲突，确保AI行为的安全性和合法性。OpenAI的模型规范中，规则包括但不限于：遵循用户指示、遵守法律、避免创造有害信息、尊重创作者权利、保护用户隐私以及避免产生不适宜的内容。这些规则为AI模型设定了明确的行为边界。

3、默认行为

默认行为是在目标和规则发生冲突时，模型应遵循的默认操作模式。OpenAI的模型规范建议，在无法明确判断时，模型应假设用户有最好的意图，在帮助用户时不越界，并促进尊重性的互动。这些默认行为为处理复杂情况提供了模板。

在实际应用中，OpenAI的模型规范为AI模型的行为设定了明确的指导原则。例如，在ChatGPT等聊天机器人中，模型需要遵循用户指示、尊重用户隐私并避免产生不适宜的内容。这些规范不仅提升了聊天机器人的用户体验，还确保了其在法律和社会规范框架内的安全运行。

此外，模型规范还为AI培训师和研究人员提供了指导方针。他们可以通过遵循这些规范来创建更加符合人类期望的AI模型，并利用人类反馈来不断优化模型的行为。例如，百度推出的曦灵数字人，就是一款基于先进的人工智能技术，能够与用户进行自然交互的数字人产品。在曦灵数字人的设计和训练过程中，也充分借鉴了OpenAI的模型规范，确保其行为符合社会期望和法律规定，为用户带来更加智能、便捷和安全的体验。