Google 官方提示工程 (Prompt Engineering)白皮书 总结

发布于:2025-04-13 ⋅ 阅读:(29) ⋅ 点赞:(0)

《大语言模型的提示工程:从基础到最佳实践》

总结

本文围绕大语言模型的提示工程展开,介绍其是设计高质量提示引导 LLM 产生准确输出的过程。探讨了 LLM 输出配置如输出长度、温度、top-K 和 top-P 等设置及其相互影响,阐述了零样本、少样本、系统、角色、上下文等提示技术,还涉及代码提示、自动提示工程。强调了提供示例、简洁设计等最佳实践,帮助读者掌握提示工程,提升使用 LLM 的效果。

思维导图

## **提示工程基础**
- 定义:设计高质量提示引导LLM产生准确输出
- 重要性:影响模型输出质量,是迭代过程
## **LLM输出配置**
- 输出长度:影响计算资源、响应时间和成本
- 采样控制:温度、top-K、top-P控制随机性和多样性
## **提示技术**
- 基础提示:零样本仅描述任务,少样本提供示例
- 引导提示:系统设定任务目的,角色赋予模型身份,上下文提供相关信息
- 优化提示:步骤回溯、思维链、自一致性、思维树、ReAct提升性能
## **代码提示**
- 代码编写:用Gemini生成Bash、Python代码
- 代码处理:解释、翻译、调试和审查代码
## **最佳实践**
- 通用原则:提供示例、简洁设计、明确输出要求
- 特定技巧:使用指令而非约束、控制token长度、利用变量等

在这里插入图片描述

详细

提示工程概述:提示工程是设计高质量提示,引导大语言模型(LLM)产生准确输出的过程。文本提示是模型预测输出的输入,其效果受模型、训练数据、配置、用词、风格等多种因素影响,是一个迭代过程。

LLM 输出配置

配置项 作用 影响
输出长度 控制响应生成的 token 数量 影响计算资源、能耗、响应时间和成本
温度 控制 token 选择的随机性 低温适用于确定性响应,高温产生更多样结果
top-K 从预测分布中选择前 K 个最可能的 token K 值越高,输出越具创造性;K=1 相当于贪婪解码
top-P 选择累积概率不超过特定值(P)的 token P 值从 0(贪婪解码)到 1(考虑所有 token),影响输出的随机性和多样性

提示技术

基础提示:零样本提示仅描述任务,如用 “Classify movie reviews as POSITIVE, NEUTRAL or NEGATIVE. Review: …” 对电影评论分类;少样本提示提供示例,帮助模型理解任务,如解析披萨订单时提供多个订单示例。

引导提示:系统提示设定模型任务目的和整体背景,如指定输出格式为 JSON;角色提示赋予模型特定身份,使其生成符合该身份的内容;上下文提示提供与任务相关的特定细节或背景信息,辅助模型生成更准确相关的回答。

优化提示:步骤回溯提示让模型先考虑相关一般问题,再解决具体任务,提高回答准确性;思维链提示通过生成中间推理步骤提升模型推理能力,结合少样本提示效果更佳;自一致性提示结合采样和多数投票,生成多样推理路径并选择最一致答案,提高回答准确性和连贯性;思维树提示允许模型同时探索多个推理路径,适用于复杂任务;ReAct 提示结合自然语言推理和外部工具,模仿人类解决问题方式。

代码提示:Gemini 可用于编写、解释、翻译、调试和审查代码。如用提示生成 Bash 脚本重命名文件,解释代码功能,将 Bash 代码翻译成 Python 代码,以及调试有错误的 Python 代码。

最佳实践:包括提供示例、设计简洁、明确输出要求、优先使用指令而非约束、控制最大 token 长度、使用变量、尝试不同输入格式和写作风格、混合少样本分类任务中的类别、适应模型更新、尝试不同输出格式、与其他提示工程师合作,以及记录提示尝试过程。

关键问题

不同采样控制参数(温度、top-K、top-P)如何相互作用?:温度、top-K 和 top-P 都影响 LLM 输出的随机性和多样性。在 Vertex Studio 中,符合 top-K 和 top-P 标准的 token 成为下一个预测 token 的候选,然后应用温度进行采样。极端设置下,一个采样配置值可能使其他配置设置失效或变得无关,如温度设为 0 时,top-K 和 top-P 变得无关。

思维链提示(Chain of Thought)的优势和局限性分别是什么?:优势在于低投入高产出,可解释性强,能提高模型在不同版本 LLM 间的鲁棒性;局限性是会增加输出 token 数量,导致预测成本更高、时间更长。

自动提示工程(Automatic Prompt Engineering)的主要步骤有哪些?:主要步骤包括使用模型生成多个提示,基于选定指标(如 BLEU 或 ROUGE)评估这些提示,选择评估得分最高的提示作为最终使用的提示,也可对选定提示进行调整后再次评估。

PDF 下载


网站公告

今日签到

点亮在社区的每一天
去签到