🔍 一、Prompt 的本质
在语言模型中,Prompt 是模型思考的起点。它通过明确指令、提供上下文或模拟语境,引导模型产出所需内容。
🧠 类比理解:
Prompt 就像你和一个非常聪明但不知道上下文的助手说话的方式——你必须清楚地告诉他你想做什么、怎么做、为什么要做。
📐 二、Prompt 的核心组成
一个高质量 Prompt 通常包含以下结构:
组成部分 | 功能说明 | 示例 |
---|---|---|
指令 | 告诉模型你要它做什么 | “请分析这段文字的情感倾向” |
输入内容 | 提供要分析或加工的文本、图片、音频等 | “文本:我今天很高兴” |
输出格式约定 | 期望模型如何组织回答结果 | “请用 JSON 格式输出” |
角色设定 | 设定模型身份/行为倾向(提升连贯性和专业性) | “你是一位经验丰富的心理学专家” |
🎯 三、Prompt 的类型与应用场景
类型 | 应用场景 | 示例 Prompt |
---|---|---|
信息提取类 | NLP任务如实体识别、关键词提取 | “请从下面文本中提取人名和地点” |
文本生成类 | 写作、报告、摘要、文案等 | “帮我写一篇关于人工智能对教育影响的议论文” |
风格控制类 | 模拟人物语气、文风 | “用鲁迅的风格写一段感慨社会的句子” |
多模态理解类 | 图文混合、图片理解等 | “图中这个物体是做什么用的?” |
交互类/工具型 | 问答系统、智能助手、机器人 | “帮我规划一个去日本五日游的行程” |
🧪 四、高级技巧:Prompt Engineering 策略
1. Few-shot Prompting(少样本提示)
提供几个示例,提升模型理解和输出一致性。
输入:今天我很开心。 输出:积极 输入:今天我被老板批评了。 输出:消极 输入:天气不错,阳光很好。 输出:
2. Chain-of-thought Prompting(思维链)
鼓励模型“分步骤”思考,提高复杂推理质量。
问题:一个人早上7点起床,步行30分钟去地铁站,地铁需要20分钟,他几点到公司? 请一步步推理并给出最终答案。
3. Role-based Prompting(设定角色)
通过指定身份提升风格与准确性。
你是一位面试官,请基于候选人笔迹图像分析其心理特质,并结合笔迹心理学给出评估。
4. 格式控制与结构提示
模型可能会迷失输出结构,建议明确告诉它你希望的格式。
请以如下 JSON 格式输出分析结果: { "情绪类型": "", "分析依据": "", "建议": "" }
🛠️ 五、如何提升 Prompt 效果?
越具体越好:模糊指令会让模型自由发挥,结果不稳定。
加约束条件:限制风格、长度、格式,让输出更可控。
多轮上下文构建:模拟对话,逐步收紧指令。
测试与微调:Prompt 是可以调试的——一句话、换顺序都可能影响结果。
🌌 六、多模态 Prompt 示例(图+文)
messages=[ {"role": "user", "content": [ {"type": "text", "text": "请结合下图和提示文字分析书写者的心理特征"}, {"type": "image_url", "image_url": {"url": "file://local_image.jpg"}}, {"type": "text", "text": "提示词:字体略倾斜,字距紧密,线条粗细不一,结构较为松散"} ]} ]
✅ 总结:Prompt 的五字诀
清、准、例、链、控
清:描述清晰
准:目标明确
例:适当举例
链:鼓励推理链
控:控制结构与风格