提示工程技术全览 · Prompting Techniques

🧭

导言:为什么需要提示技术

Prompting Techniques · 总览

提示工程的目标,是有效地设计与改进提示词,从而在各类任务上从大语言模型(LLM)拿到更好的结果。

前面章节里的基础示例虽然有趣,但只是入门。这一章要讲的是更进阶的提示工程技术——它们让我们能完成更复杂的任务,并提升 LLM 的可靠性与性能。下面 18 种技术,大致可以按「需要什么能力」来分组阅读:从最朴素的零样本/少样本,到引导模型一步步推理的思维链家族,再到让模型连接外部知识、调用工具、甚至像智能体一样反思与行动的高级范式。

📌 怎么读这份文档每一节都对应原指南里的一种技术,标题里给出中英文名与提出它的论文。技术之间常常彼此叠加(例如自洽性建立在思维链之上、ReAct 融合了思维链与工具调用),所以遇到「📎 需先理解」这类提示时,可以点链接回看前置概念。

0️⃣

零样本提示 Zero-shot Prompting

最基础的用法 · 不给任何示例

优势	含义
Token 效率	聚焦结构而非细节内容,减少所需 token 数。
公平比较	弱化具体示例的影响,为比较不同解题模型提供更公平的方式。
零样本效力	可视为一种零样本提示——具体示例的影响被降到最低。

方法	核心思路
Prompt-OIRL	用离线逆强化学习,生成「依赖具体查询」的提示。
OPRO	用 LLM 来优化提示;让模型「Take a deep breath」竟提升了数学题表现。
AutoPrompt	基于梯度引导的搜索,为多种任务自动构造提示。
Prefix Tuning	微调的轻量替代:为 NLG 任务前置一段可训练的连续前缀。
Prompt Tuning	通过反向传播学习「软提示(soft prompts)」。

技术	提出	核心一句话
零样本	—	不给示例,直接下指令,靠模型内在能力。
少样本	Brown 等 / Touvron 2023	放几对演示做上下文学习,规模够大才涌现。
思维链 CoT	Wei 2022	演示出中间推理步骤,或加「一步步思考」。
元提示	Zhang 2024	关注问题的结构/句法而非具体内容,省 token。
自洽性	Wang 2022	对 CoT 多采样多条路径,再投票取众数答案。
生成知识	Liu 2022	先让模型自造相关知识,再据此作答。
提示链	—	把任务拆成子任务,前一步输出喂给后一步。
思维树 ToT	Yao / Long 2023	维护思路树,自评 + 搜索,带前瞻与回溯。
RAG	Lewis 2021	检索外部文档拼进上下文,缓解幻觉、接最新知识。
ART	Paranjape 2023	自动从库取演示,把推理写成可调工具的程序。
APE	Zhou 2022	把写提示当黑盒优化,让模型自动生成并筛选指令。
Active-Prompt	Diao 2023	按不确定性挑最该标注的样例做 CoT 标注。
DSP	Li 2023	训练小策略模型生成线索,引导黑盒大模型。
PAL	Gao 2022	生成可执行程序,把计算交给解释器。
ReAct	Yao 2022	交错「思考→行动→观察」,边推理边调工具。
Reflexion	Shinn 2023	把环境反馈转成语言自反思,存入记忆迭代改进。
多模态 CoT	Zhang 2023	图+文两阶段:先生成依据,再推断答案。
GraphPrompt	Liu 2023	面向图数据的提示框架(细节待补)。

导言:为什么需要提示技术

零样本提示 Zero-shot Prompting

这种技术在做什么

少样本提示 Few-shot Prompting

核心思路

思维链 Chain-of-Thought (CoT)

标准思维链(Few-shot CoT)

零样本思维链(Zero-shot CoT)

自动思维链(Auto-CoT)

元提示 Meta Prompting

五个关键特征

相比少样本提示的优势

自洽性 Self-Consistency

生成知识提示 Generated Knowledge Prompting

它解决什么问题

提示链 Prompt Chaining

为什么要把提示串起来

思维树 Tree of Thoughts (ToT)

ToT 是怎么运作的

两个版本的差异

把 ToT 当成一句提示用

检索增强生成 RAG

RAG 是什么、怎么工作

自动推理与工具使用 ART

ART 怎么运作

自动提示工程师 APE

延伸:自动优化提示的相关工作

主动提示 Active-Prompt

定向刺激提示 Directional Stimulus Prompting

核心机制

程序辅助语言模型 PAL

它和 CoT 的根本差异

ReAct(推理 + 行动)

它为何能改善表现

实验结论

Reflexion(语言化的强化)

三个组成模型

效果

什么时候该用 Reflexion

多模态思维链 Multimodal CoT

图提示 GraphPrompt

技术全景对照表