书接上文,关于怎么用好AI,主要还是要学会提问。有时候可能并不是模型不行,而是你问的有问题,导致模型只能跟着你(错误的)的思路去生成,结果当然是食之无味弃之可惜。
提问=指令=提示词=prompt
其实都是一样的,有很多同学会问不就是输入的问题么?提示词就提示词,但是为什么叫提示词工程?
提示词作为大模型的核心输入指令,是直接影响模型的理解准确性和输出质量的。
优质的 Prompt 能显著提升大语言模型在逻辑推理、步骤分解等复杂任务上的表现。
随着模型能力不断提升,我们问的问题也越来越复杂,而问题本身的构造,从一开始的“把需求说明白”,转向在包含多步骤、多工具和多 Agent 协作的 Workflow 中进行系统优化。
大语言模型的本质,是预测下一个 token 的概率模型。它接收一段文本,根据训练中学到的模式判断接下来最可能出现的 token。预测完成后,这个 token 会被添加到输入末尾,然后继续预测下一个。每一步输出都依赖于前面的上下文和已掌握的规律。
因此,撰写 Prompt 的过程,就是在引导模型生成所需的 token 序列,让它按照你的预期一步步输出结果。
提示词工程的目标,是设计能让模型输出准确结果的 Prompt。这通常需要反复调整,包括 Prompt 的长度、语言风格和结构等等等等...
今天主要是给大家分享一个工具+两个技巧,让你真正学会提示词工程是如何调优&迭代的!
一个工具:PromptPilot
Prompt调优是和AI打交道必备的技能,而传统的方式是去写一段prompt,然后投喂给AI生成,发现效果不好,再改一改重新投喂。但是有2个问题:
1、写好的Prompt如何进行资产管理
2、调优后的Prompt发现还没有上一版的好,但是忘了上一版怎么写的了
包括我之前也写了很多Prompt,反反复复调整了几版,最终确定下来。如果说只用一个模型/工具还好,封装成智能体就行了。但是有时候也会切换工具,那就需要来回扒提示词。所以我之前的Prompt管理用的很笨的方法就是用备忘录:

从资产管理角度来说,也不失为一种办法,但是第二个问题还是很难解决。一个是你不断调整,发现之前的某个版本效果还不错,但是你找不回来又想不起来;一个是你想看看调优之后的效果和之前的哪个更好,只能2个都存下来并依次投喂给模型去测试。不是不行,而是麻烦。
后来也出现了很多Prompt调优的小工具或者是网站,上面基本都有用AI帮你生成提示词的功能,包括很多好心人给的提示词模板。但是体验下来,我还是觉得PromptPilot最好。
是字节旗下火山引擎推出的一个平台,同样能帮你生成一个优质提示词,但是最最关键的是Prompt版本管理能力,真的是完美解决我上面提到的两个问题!

Prompt生成&调试
其实界面功能还是非常简单明了的,自然语言提出你的需求(你希望这个提示词执行什么任务),就可以给你生成一个:


生成之后,可以再进行优化、复制、验证
优化Prompt


比如这种平台字数限制的规则,模型一般来说肯定是不知道的,一眼能看到优化点的就可以直接在这个地方给调试掉。但是如果你看不到优化点,你觉得已经足够好了,但还是要以结果为导向,这个时候就可以用验证这个功能了。
Prompt验证
验证有2个模式选择:评分模式和GSB比较模式

评分模式

点击生成模型回答可以AI生成变量内容,查看模型回答的效果:

模型回答的结果可以再进行改写或者是添加至评测集,而且可以进行批量评测,基于平台提供的评分档位进行批量打分。
GSB比较模式

和评分模式差不多,不一样的是由2个模型进行输出,更多的是测模型和Prompt之间的适配。有时候一个好的Prompt搭载不同的底模,输出的质量也是不一样的。

生成之后会弹出一个弹窗,通过GSB选择判断2个模型输出的结果质量,并借助评分和原因来反哺优化Prompt。
Prompt版本管理
而我们每次的优化,都可以在标题右边的icon进行版本管理,可以随时切换至之前所保存的任意一版的Prompt。这个是我认为最好用的一个功能点,可以对Prompt进行版本管理和切换。

PromptPilot中,每个「Prompt调优任务」是可以管理多个Prompt版本。不同版本的Prompt及其对应的评测集相互独立控制。每个调优任务的实现机制为:
- 帮助用户从「任务」生成「初始Prompt」;
- 调试「初始Prompt」,并形成评测数据集的种子「样本」;
- 基于种子「样本」,批量生成样本并构建「评测数据集」
- 平台以提高样本整体评分为目标,基于「评测数据集」,并结合特定算法,形成一个优化后的新版本Prompt。
其中,每一条样本包括提问、回答、评分结果。在不同任务场景、调优模式下,每一条样本的元素构成不尽相同。

这个平台上还有很多功能,这个就等大家去挖掘了,我就不一一展开演示了:
多轮对话:适用于需要与模型助手进行多轮次对话的任务。用户设置
系统Prompt并输入用户内容,模型以助手身份与之开展多轮交流。视觉理解:适用于包含图片信息的任务。用户输入包含
变量(文本/图像)的Prompt,与模型进行一轮问答,以解决用户定义的任务。
场景分类 | 功能 | 说明 |
Prompt快速优化 | 一键改写 | 在Prompt生成模块或Prompt调优模块的调试流程中,用户对当前Prompt整体不满意,使用AI一键改写。 |
基于反馈优化 | 在Prompt生成模块或Prompt调优模块的调试流程中,用户对当前Prompt局部不满意,输入反馈引导AI进行优化。 | |
构建用户提问 | AI联网生成变量 | 在Prompt调优模块的调试流程中,用户需要模型访问互联网,生成更多样化的变量内容。 |
AI批量生成变量 | 在Prompt 调优模块的批量流程中,用户需要以种子样本为基础,批量生成数据集用于Prompt优化。 | |
生成模型回答 | 启用领域知识库 | 在Prompt生成模块中,支持用户使用领域知识帮助Prompt优化迭代。 |
模型工具调用 | 在Prompt调优模块中,用户需要大模型调用外部工具或函数进行回复,突破纯语言处理局限,实现与真实世界的交互和操作。 | |
优化理想回答 | 在Prompt调优模块中,用户没有明确的理想回答时,可参考AI生成内容,或进一步提供用户反馈、修改AI思考步骤以优化AI生成结果。 | |
完成回答评分 | 选用GSB比较模式 | 在Prompt调优模块中,用户对于此任务没有理想回答或明确的评分标准,可选用GSB比较模式。 |
构建复杂评分标准 | 在Prompt 调优模块的批量流程中,平台支持一种领域特定语言 (DSL) ,以满足用户构建复杂评分标准的需求。例如,当模型输出为 JSON 格式且包含多个字段时,用户可针对不同字段分别设定评分规则,最终汇总得出总分。详情参见 评分 DSL。 | |
AI批量智能评分 | 在Prompt 调优模块的批量流程中,用户需要以种子评分结果为基础,对模型回答进行批量AI智能评分。 | |
模型设置 | 自定义模型 | 在Prompt生成模块或Prompt调优模块的调试流程中,用户可以使用第三方模型。当前仅支持独立站版本。 |
修改模型推理参数 | 在Prompt生成模块或Prompt调优模块的调试流程中,用户可以调整模型推理参数(Temperature,Top P,参数含义见请求体)。当前仅支持火山方舟版本。 | |
开启免费模型精调 | 在Prompt调优模块的「智能优化」流程中,用户可以进一步勾选「免费智能精调」,以突破Prompt优化瓶颈,并在精调后的模型上执行优化后的Prompt推理。当前仅支持火山方舟版本。 | |
其他 | 开启单样本调试模式 | 在Prompt调优模块的批量流程中,用户处理数据集时,需要对单个样本进行精细化调试。 |
两个技巧:逆向工程&人设法
工具是有了,但是好的Prompt一定不是AI跑出来了的,毕竟用AI生成的Prompt,本质上可能也是封装了一套System Prompt而已。所以今天不讲结构化,我们说说逆向工程和人设法。
逆向工程
逆向提示词工程(Reverse Prompt Engineering),简单来说,就是从一篇已经存在的、你很喜欢的文章,反向推导出生成这篇文章的“指令”。
就有点像你吃到一道特别好吃的菜,你想学什么做。那肯定不是直接问厨师一句“怎么做一道好吃的菜?”,而是直接问:“这道菜里到底放了什么调料,火候是多大,用了什么烹饪手法?”
当你把一段范文丢给AI,让它做逆向工程时,它会像一个顶级的文学评论家+数据分析师一样,去解构这段文字:
- 语气和风格: 是严肃的,还是幽默的?是正式的,还是口语化的?
- 用词和句式: 是喜欢用长句还是短句?是爱用专业术语还是大白话?
- 修辞手法: 有没有用比喻、排比、反问?
- 文章结构: 是总分总结构,还是时间线叙事?段落长短如何?
- 论证方式: 是靠数据说话,还是靠讲故事来打动人?
AI会把这些要素全部提炼出来,组合成一条全新的、详细的Prompt。这条Prompt,就是那份能复刻出同样风格文章的“菜谱”。
步骤很简单:
1、找到你的“参考文本”: 找到一篇你特别喜欢的文章。可以是你老板写的邮件,可以是某个爆款公众号的推文,甚至可以是乔布斯的演讲稿。
2、结合Prompt给模型:
请对下列{文本}进行逆向提示词工程,生成一个可以仿写这段文章的提示词。 要求: 1. 需提炼文章的语气,写作风格,用词,句式等各种写作方面的要素,你可以根据写作领域的专业知识,进行更多写作要素的分析。 2. 生成的提示词,是要发送给AI的,让它能以任意主题,写出与{文本}风格类似的文章。 文本 = {[这里粘贴你的范文]}
案例
直接用上面案例生成的小红书风格文案为参考文本。
输入:
请对下列{文本}进行逆向提示词工程,生成一个可以仿写这段文章的提示词。
要求:
1. 需提炼文章的语气,写作风格,用词,句式等各种写作方面的要素,你可以根据写作领域的专业知识,进行更多写作要素的分析。
2. 生成的提示词,是要发送给AI的,让它能以任意主题,写出与{文本}风格类似的文章。
文本 = {宝子们👋,今天我去了一家超绝的咖啡馆☕!那里环境老好了,装修超有格调,温馨又舒适😍。我点了杯拿铁,奶泡细腻,咖啡香醇,味道棒极了👏。服务员态度也超亲切,让人浑身舒坦~强烈建议大家都去体验一波😘!}模型输出:
**写作要素分析:**
1. **语气**
- 轻松、活泼、亲切,像是在跟朋友分享小秘密。
- 带有较强的个人情绪色彩,感叹号频繁出现,强调兴奋和推荐的情绪。
2. **写作风格**
- 典型的“小红书/朋友圈分享文案”风格。
- 使用大量口语化表达,比如“宝子们”“超绝”“老好了”。
- 语句简短,感情直接,不拐弯抹角。
3. **用词特点**
- 大量夸张化、感叹式形容词(超绝、超有格调、棒极了)。
- 情绪化副词(强烈、老好、超亲切)。
- 使用网络流行语和俏皮昵称(宝子们、体验一波)。
- 用表情符号强化情绪(👋☕😍👏😘)。
4. **句式特点**
- 短句为主,断句明显,增强节奏感。
- 描述顺序按“整体感受 → 细节描写 → 总结推荐”。
- 经常用波浪线“~”作语气延伸。
5. **情绪表达**
- 强调“推荐”和“个人感受”,带动读者情绪。
- 生动的感官描写(视觉、味觉、触觉)。
---
**AI 提示词(Prompt)**
你是一个生活方式博主,用轻松、活泼、亲切的语气写一篇短文,像是在和朋友分享你的新发现。要求:
- 主题可以自由选择,但必须是**强烈的正面个人体验**(如旅行、美食、购物、娱乐等)。
- 使用**大量口语化词汇**,适当加入**网络流行语、亲昵称呼**(如“宝子们”“姐妹”“小伙伴们”)。
- 模仿社交平台笔记风格,多用短句,感情直接外放。
- 善用**夸张和感叹式的形容词/副词**(如“超绝”“绝美”“老好了”“棒极了”)来强化情绪。
- 文中多用**表情符号**(emoji)来表达感受,例如:😍👏☕😘✨等。
- 写作结构参考:
1. 开头用亲昵称呼+问候切入;
2. 简述体验的场景;
3. 按感官描写细节(环境、外观、味道、服务、感受等);
4. 用热情的语气强烈推荐给读者;
5. 结尾可以用“强烈建议大家…”或“快去冲!”等收尾。
- 语气要自然,不要像广告,更像真实生活的分享。 
我们再拿着这个“菜谱”再去生成一下试试:

这个效果确实非常稳定,而且比我用那种结构化的小红书风格润色助手(结构化prompt)的效果要好得多。
掌握逆向分析技术的工程师一天内就能生成多种风格的写作机器人!!!(当然,这篇不是我生成的昂~)
人设法
这个技巧,听起来耳熟。不就是给模型指定一个角色嘛~
实则不然!
我们以前的思路是什么?让AI扮演角色。“请你扮演一个xxx”。
但你想想,你让一个本质上是数据和算法的集合去“扮演”,它能演成啥样?它只能从海量数据里,找一个最大公约数的、最刻板印象的“角色”给你。所以,你得到的答案,自然也就平平无奇。
而“人设法”的核心,恰恰相反:不是要AI当什么角色,而是要它把你当成什么角色。
你想想,你在现实生活中跟人交流,是不是会下意识地根据对方的身份和认知水平,来调整你的说话方式?你跟一个5岁小孩解释“什么是互联网”,和跟一个计算机系博士生解释,用的词汇、举的例子、说话的深度,能一样吗?
AI也是一个道理。它的模型里,存储了人类社会海量的对话文本。这些文本里,本身就包含了各种各样的人设对话。有专家对新手的,有老板对员工的,有医生对病人的... 当你清晰地告诉AI“我是谁”、“我处于什么水平”、“我的目标是什么”的时候,你其实是在帮它做一个精准的“筛选”。
我们拿案例来做对比:
比如我想了解社交营销,那定义角色的Prompt可能会是:
### 角色
你是一位专业的营销讲师
### 目标
在未来3个月内,不花一分钱广告费,将该品牌的Instagram粉丝做到1000人。
### 动作
为创始人提供一份超级详细、手把手、可以直接落地执行的社交媒体营销入门指南,具体说明第一周、第一个月应该做的事情,包括每天需要花费的时间、发布内容的类型,并给出几个帖子文案的例子。
### 要求
使用最通俗易懂的语言。
### 格式
无特殊格式要求,内容清晰、有条理即可。
而用人设法的Prompt会变成:
请把我当成一个刚刚辞职创业、手头只有5000块启动资金的小品牌创始人。
我的品牌是做手工烘焙的,目标客户是20-35岁的女性。
我对社交媒体营销一窍不通,连什么是Reels和Shorts都分不太清。
我希望能得到一份超级详细、手把手、可以直接落地执行的入门指南,目标是在未来3个月内,不花一分钱广告费,把我的Instagram粉丝做到1000人。
请用最通俗易懂的语言告诉我,我第一周、第一个月应该具体做什么,每天需要花多长时间,发什么类型的内容,甚至可以给我几个帖子文案的例子。
底模都是用的GPT-5,生成的质量相对来说应该都还不错,我个人更倾向于第二个,生成的内容更容易理解,尤其是一些名词确实不懂,还会给一个名词解释。
第二个提问,我给了AI一个极其具体的人设——我的角色、我的困境、我的资源、我的目标。AI不再需要去“扮演”一个空洞的讲师,而是直接进入了“辅导一个资源有限的创业小白”这个具体的场景。它给出的答案,不再是放之四海而皆准的“正确的废话”,而是一份可以立刻打印出来、贴在墙上执行的行动计划。
当然,这招也有翻车的时候。人设法和角色设定这两种都可以尝试尝试。
如果说逆向提示词,就是让模仿变得高效,那人设法是让你和AI的沟通变的精准。
“人设法”是精准打击,它通过定义“你是谁”,来让AI给出最适合你的答案。而“逆向提示词”是风格复刻,它能“偷”来任何你想要的文字风格,让你的内容生产力爆表!
