微软开源创新框架Prompt Wizard

最近，微软开源了一个创新框架-Prompt Wizard，旨在自动化和简化提示优化过程，提升大型语言模型（LLMs）在特定任务中的表现。PromptWizard通过自我进化和自适应机制，结合迭代反馈和高效的探索技术，能够在短时间内生成高效的提示，显著减少传统提示工程所需的时间和精力‌。

Prompt Wizard

Prompt Wizard的核心由多个模块组成，通过其自我进化和自我适应的机制以及反馈驱动的批评和综合过程，实现了对大模型提示指令和上下文示例的迭代优化。

首先，PromptWizard会对问题的清晰表述和初始提示进行设定，这为整个优化过程奠定了基础。

接着，PromptWizard进入迭代优化提示指令的阶段，由变异组件（Mutate Component）主导。变异组件利用预定义的认知启发式或思考风格，对初始提示进行变异，生成多种不同的提示变体。这些思考风格引导大型语言模型从不同角度审视问题，创造出丰富多样的提示指令。

变异组件生成的提示变体随后被送入评分组件（Scoring Component）进行评估。评分组件的任务是对这些变异提示在一小批训练样本上的表现进行打分。评分机制可以基于传统的指标，如F1分数，也可以使用大型语言模型本身作为评估器。通过这种方式，系统能够系统地识别出最有效的提示，同时淘汰表现不佳的提示。这个过程确保了只有那些真正有助于提升模型性能的提示能够进入下一步。

在评分组件筛选出表现最佳的变异提示后，批评组件开始发挥作用。这种针对性的反馈对于精炼提示至关重要，因为它提供了对特定弱点的洞察，允许进行有针对性的改进，而不是进行一般性的更改。批评组件的反馈是具体且详细的，不仅指出提示在哪些方面做得好，更重要的是，它明确指出了提示需要改进的地方，为下一步的优化提供了明确的方向。

综合组件是迭代优化过程中的最后一个环节，利用批评组件的反馈来优化最佳提示。综合组件重新表述并增强指令，使其更具任务针对性和优化性。

在进行了初步优化之后，PromptWizard还通过CoT推理来增强模型性能。由推理组件和验证组件共同完成。推理组件接收选定的少量示例，并为每个示例生成详细的推理链，以促进问题解决。这些推理链不仅提供了从问题到答案的清晰路径，还增强了模型对任务的理解和推理能力。

验证组件则使用大型语言模型检查示例（问题、推理）的一致性和相关性，有效地过滤掉了错误的示例和/或幻觉推理，确保了最终生成的提示和示例的质量。

为了全面评估PromptWizard框架的性能，研究人员在GSM8K、AQUARAT、SVAMP、Ethos、MedQA、MMLU以及BBH等主流基准测试中进行了综合评测，结果显示在PromptWizard框架强化下大模型的回答能力得到了显著提升。