AI时代学会提问（二）：1个工具 2个技巧

书接上文，关于怎么用好AI，主要还是要学会提问。有时候可能并不是模型不行，而是你问的有问题，导致模型只能跟着你（错误的）的思路去生成，结果当然是食之无味弃之可惜。

提问=指令=提示词=prompt

其实都是一样的，有很多同学会问不就是输入的问题么？提示词就提示词，但是为什么叫提示词工程？

提示词作为大模型的核心输入指令，是直接影响模型的理解准确性和输出质量的。

优质的 Prompt 能显著提升大语言模型在逻辑推理、步骤分解等复杂任务上的表现。

随着模型能力不断提升，我们问的问题也越来越复杂，而问题本身的构造，从一开始的“把需求说明白”，转向在包含多步骤、多工具和多 Agent 协作的 Workflow 中进行系统优化。

大语言模型的本质，是预测下一个 token 的概率模型。它接收一段文本，根据训练中学到的模式判断接下来最可能出现的 token。预测完成后，这个 token 会被添加到输入末尾，然后继续预测下一个。每一步输出都依赖于前面的上下文和已掌握的规律。

因此，撰写 Prompt 的过程，就是在引导模型生成所需的 token 序列，让它按照你的预期一步步输出结果。

提示词工程的目标，是设计能让模型输出准确结果的 Prompt。这通常需要反复调整，包括 Prompt 的长度、语言风格和结构等等等等...

今天主要是给大家分享一个工具+两个技巧，让你真正学会提示词工程是如何调优&迭代的！

一个工具：PromptPilot

Prompt调优是和AI打交道必备的技能，而传统的方式是去写一段prompt，然后投喂给AI生成，发现效果不好，再改一改重新投喂。但是有2个问题：

1、写好的Prompt如何进行资产管理
2、调优后的Prompt发现还没有上一版的好，但是忘了上一版怎么写的了

包括我之前也写了很多Prompt，反反复复调整了几版，最终确定下来。如果说只用一个模型/工具还好，封装成智能体就行了。但是有时候也会切换工具，那就需要来回扒提示词。所以我之前的Prompt管理用的很笨的方法就是用备忘录：

从资产管理角度来说，也不失为一种办法，但是第二个问题还是很难解决。一个是你不断调整，发现之前的某个版本效果还不错，但是你找不回来又想不起来；一个是你想看看调优之后的效果和之前的哪个更好，只能2个都存下来并依次投喂给模型去测试。不是不行，而是麻烦。

后来也出现了很多Prompt调优的小工具或者是网站，上面基本都有用AI帮你生成提示词的功能，包括很多好心人给的提示词模板。但是体验下来，我还是觉得PromptPilot最好。

是字节旗下火山引擎推出的一个平台，同样能帮你生成一个优质提示词，但是最最关键的是Prompt版本管理能力，真的是完美解决我上面提到的两个问题！

Prompt生成&调试

其实界面功能还是非常简单明了的，自然语言提出你的需求（你希望这个提示词执行什么任务），就可以给你生成一个：

生成之后，可以再进行优化、复制、验证

优化Prompt

比如这种平台字数限制的规则，模型一般来说肯定是不知道的，一眼能看到优化点的就可以直接在这个地方给调试掉。但是如果你看不到优化点，你觉得已经足够好了，但还是要以结果为导向，这个时候就可以用验证这个功能了。

Prompt验证

验证有2个模式选择：评分模式和GSB比较模式

评分模式

点击生成模型回答可以AI生成变量内容，查看模型回答的效果：

模型回答的结果可以再进行改写或者是添加至评测集，而且可以进行批量评测，基于平台提供的评分档位进行批量打分。

GSB比较模式

和评分模式差不多，不一样的是由2个模型进行输出，更多的是测模型和Prompt之间的适配。有时候一个好的Prompt搭载不同的底模，输出的质量也是不一样的。

生成之后会弹出一个弹窗，通过GSB选择判断2个模型输出的结果质量，并借助评分和原因来反哺优化Prompt。

Prompt版本管理

而我们每次的优化，都可以在标题右边的icon进行版本管理，可以随时切换至之前所保存的任意一版的Prompt。这个是我认为最好用的一个功能点，可以对Prompt进行版本管理和切换。

PromptPilot中，每个「Prompt调优任务」是可以管理多个Prompt版本。不同版本的Prompt及其对应的评测集相互独立控制。每个调优任务的实现机制为：

帮助用户从「任务」生成「初始Prompt」；
调试「初始Prompt」，并形成评测数据集的种子「样本」；
基于种子「样本」，批量生成样本并构建「评测数据集」
平台以提高样本整体评分为目标，基于「评测数据集」，并结合特定算法，形成一个优化后的新版本Prompt。

其中，每一条样本包括提问、回答、评分结果。在不同任务场景、调优模式下，每一条样本的元素构成不尽相同。

这个平台上还有很多功能，这个就等大家去挖掘了，我就不一一展开演示了：

多轮对话：适用于需要与模型助手进行多轮次对话的任务。用户设置系统Prompt并输入用户内容，模型以助手身份与之开展多轮交流。
视觉理解：适用于包含图片信息的任务。用户输入包含变量（文本/图像）的Prompt，与模型进行一轮问答，以解决用户定义的任务。

场景分类	功能	说明
Prompt快速优化	一键改写	在Prompt生成模块或Prompt调优模块的调试流程中，用户对当前Prompt整体不满意，使用AI一键改写。
Prompt快速优化	基于反馈优化	在Prompt生成模块或Prompt调优模块的调试流程中，用户对当前Prompt局部不满意，输入反馈引导AI进行优化。
构建用户提问	AI联网生成变量	在Prompt调优模块的调试流程中，用户需要模型访问互联网，生成更多样化的变量内容。
构建用户提问	AI批量生成变量	在Prompt 调优模块的批量流程中，用户需要以种子样本为基础，批量生成数据集用于Prompt优化。
生成模型回答	启用领域知识库	在Prompt生成模块中，支持用户使用领域知识帮助Prompt优化迭代。
	模型工具调用	在Prompt调优模块中，用户需要大模型调用外部工具或函数进行回复，突破纯语言处理局限，实现与真实世界的交互和操作。
	优化理想回答	在Prompt调优模块中，用户没有明确的理想回答时，可参考AI生成内容，或进一步提供用户反馈、修改AI思考步骤以优化AI生成结果。
完成回答评分	选用GSB比较模式	在Prompt调优模块中，用户对于此任务没有理想回答或明确的评分标准，可选用GSB比较模式。
	构建复杂评分标准	在Prompt 调优模块的批量流程中，平台支持一种领域特定语言 (DSL) ，以满足用户构建复杂评分标准的需求。例如，当模型输出为 JSON 格式且包含多个字段时，用户可针对不同字段分别设定评分规则，最终汇总得出总分。详情参见评分 DSL。
	AI批量智能评分	在Prompt 调优模块的批量流程中，用户需要以种子评分结果为基础，对模型回答进行批量AI智能评分。
模型设置	自定义模型	在Prompt生成模块或Prompt调优模块的调试流程中，用户可以使用第三方模型。当前仅支持独立站版本。
	修改模型推理参数	在Prompt生成模块或Prompt调优模块的调试流程中，用户可以调整模型推理参数（Temperature，Top P，参数含义见请求体）。当前仅支持火山方舟版本。
	开启免费模型精调	在Prompt调优模块的「智能优化」流程中，用户可以进一步勾选「免费智能精调」，以突破Prompt优化瓶颈，并在精调后的模型上执行优化后的Prompt推理。当前仅支持火山方舟版本。
其他	开启单样本调试模式	在Prompt调优模块的批量流程中，用户处理数据集时，需要对单个样本进行精细化调试。

两个技巧：逆向工程&人设法

工具是有了，但是好的Prompt一定不是AI跑出来了的，毕竟用AI生成的Prompt，本质上可能也是封装了一套System Prompt而已。所以今天不讲结构化，我们说说逆向工程和人设法。

逆向工程

逆向提示词工程（Reverse Prompt Engineering），简单来说，就是从一篇已经存在的、你很喜欢的文章，反向推导出生成这篇文章的“指令”。

就有点像你吃到一道特别好吃的菜，你想学什么做。那肯定不是直接问厨师一句“怎么做一道好吃的菜？”，而是直接问：“这道菜里到底放了什么调料，火候是多大，用了什么烹饪手法？”

当你把一段范文丢给AI，让它做逆向工程时，它会像一个顶级的文学评论家+数据分析师一样，去解构这段文字：

语气和风格： 是严肃的，还是幽默的？是正式的，还是口语化的？
用词和句式： 是喜欢用长句还是短句？是爱用专业术语还是大白话？
修辞手法： 有没有用比喻、排比、反问？
文章结构： 是总分总结构，还是时间线叙事？段落长短如何？
论证方式： 是靠数据说话，还是靠讲故事来打动人？

AI会把这些要素全部提炼出来，组合成一条全新的、详细的Prompt。这条Prompt，就是那份能复刻出同样风格文章的“菜谱”。

步骤很简单：

1、找到你的“参考文本”： 找到一篇你特别喜欢的文章。可以是你老板写的邮件，可以是某个爆款公众号的推文，甚至可以是乔布斯的演讲稿。
2、结合Prompt给模型：
请对下列{文本}进行逆向提示词工程，生成一个可以仿写这段文章的提示词。 
要求: 
1. 需提炼文章的语气，写作风格，用词，句式等各种写作方面的要素，你可以根据写作领域的专业知识，进行更多写作要素的分析。 
2. 生成的提示词，是要发送给AI的，让它能以任意主题，写出与{文本}风格类似的文章。 
文本 = {[这里粘贴你的范文]}

案例

直接用上面案例生成的小红书风格文案为参考文本。

输入：

请对下列{文本}进行逆向提示词工程，生成一个可以仿写这段文章的提示词。

要求:

1. 需提炼文章的语气，写作风格，用词，句式等各种写作方面的要素，你可以根据写作领域的专业知识，进行更多写作要素的分析。

2. 生成的提示词，是要发送给AI的，让它能以任意主题，写出与{文本}风格类似的文章。 

文本 = {宝子们👋，今天我去了一家超绝的咖啡馆☕！那里环境老好了，装修超有格调，温馨又舒适😍。我点了杯拿铁，奶泡细腻，咖啡香醇，味道棒极了👏。服务员态度也超亲切，让人浑身舒坦~强烈建议大家都去体验一波😘！}

模型输出：

**写作要素分析：**

1. **语气**  
   - 轻松、活泼、亲切，像是在跟朋友分享小秘密。  
   - 带有较强的个人情绪色彩，感叹号频繁出现，强调兴奋和推荐的情绪。  

2. **写作风格**  
   - 典型的“小红书/朋友圈分享文案”风格。  
   - 使用大量口语化表达，比如“宝子们”“超绝”“老好了”。  
   - 语句简短，感情直接，不拐弯抹角。  

3. **用词特点**  
   - 大量夸张化、感叹式形容词（超绝、超有格调、棒极了）。  
   - 情绪化副词（强烈、老好、超亲切）。  
   - 使用网络流行语和俏皮昵称（宝子们、体验一波）。  
   - 用表情符号强化情绪（👋☕😍👏😘）。  

4. **句式特点**  
   - 短句为主，断句明显，增强节奏感。  
   - 描述顺序按“整体感受 → 细节描写 → 总结推荐”。  
   - 经常用波浪线“~”作语气延伸。  

5. **情绪表达**  
   - 强调“推荐”和“个人感受”，带动读者情绪。  
   - 生动的感官描写（视觉、味觉、触觉）。  

---

**AI 提示词（Prompt）**  
你是一个生活方式博主，用轻松、活泼、亲切的语气写一篇短文，像是在和朋友分享你的新发现。要求：  

- 主题可以自由选择，但必须是**强烈的正面个人体验**（如旅行、美食、购物、娱乐等）。  
- 使用**大量口语化词汇**，适当加入**网络流行语、亲昵称呼**（如“宝子们”“姐妹”“小伙伴们”）。  
- 模仿社交平台笔记风格，多用短句，感情直接外放。  
- 善用**夸张和感叹式的形容词/副词**（如“超绝”“绝美”“老好了”“棒极了”）来强化情绪。  
- 文中多用**表情符号**（emoji）来表达感受，例如：😍👏☕😘✨等。  
- 写作结构参考：  
  1. 开头用亲昵称呼+问候切入；  
  2. 简述体验的场景；  
  3. 按感官描写细节（环境、外观、味道、服务、感受等）；  
  4. 用热情的语气强烈推荐给读者；  
  5. 结尾可以用“强烈建议大家…”或“快去冲！”等收尾。  
- 语气要自然，不要像广告，更像真实生活的分享。

我们再拿着这个“菜谱”再去生成一下试试：

这个效果确实非常稳定，而且比我用那种结构化的小红书风格润色助手（结构化prompt）的效果要好得多。

掌握逆向分析技术的工程师一天内就能生成多种风格的写作机器人！！！（当然，这篇不是我生成的昂～）

人设法

这个技巧，听起来耳熟。不就是给模型指定一个角色嘛～

实则不然！

我们以前的思路是什么？让AI扮演角色。“请你扮演一个xxx”。

但你想想，你让一个本质上是数据和算法的集合去“扮演”，它能演成啥样？它只能从海量数据里，找一个最大公约数的、最刻板印象的“角色”给你。所以，你得到的答案，自然也就平平无奇。

而“人设法”的核心，恰恰相反：不是要AI当什么角色，而是要它把你当成什么角色。

你想想，你在现实生活中跟人交流，是不是会下意识地根据对方的身份和认知水平，来调整你的说话方式？你跟一个5岁小孩解释“什么是互联网”，和跟一个计算机系博士生解释，用的词汇、举的例子、说话的深度，能一样吗？

AI也是一个道理。它的模型里，存储了人类社会海量的对话文本。这些文本里，本身就包含了各种各样的人设对话。有专家对新手的，有老板对员工的，有医生对病人的... 当你清晰地告诉AI“我是谁”、“我处于什么水平”、“我的目标是什么”的时候，你其实是在帮它做一个精准的“筛选”。

我们拿案例来做对比：

比如我想了解社交营销，那定义角色的Prompt可能会是：

### 角色
你是一位专业的营销讲师

### 目标
在未来3个月内，不花一分钱广告费，将该品牌的Instagram粉丝做到1000人。

### 动作
为创始人提供一份超级详细、手把手、可以直接落地执行的社交媒体营销入门指南，具体说明第一周、第一个月应该做的事情，包括每天需要花费的时间、发布内容的类型，并给出几个帖子文案的例子。

### 要求
使用最通俗易懂的语言。

### 格式
无特殊格式要求，内容清晰、有条理即可。

而用人设法的Prompt会变成：

请把我当成一个刚刚辞职创业、手头只有5000块启动资金的小品牌创始人。
我的品牌是做手工烘焙的，目标客户是20-35岁的女性。
我对社交媒体营销一窍不通，连什么是Reels和Shorts都分不太清。
我希望能得到一份超级详细、手把手、可以直接落地执行的入门指南，目标是在未来3个月内，不花一分钱广告费，把我的Instagram粉丝做到1000人。
请用最通俗易懂的语言告诉我，我第一周、第一个月应该具体做什么，每天需要花多长时间，发什么类型的内容，甚至可以给我几个帖子文案的例子。

底模都是用的GPT-5，生成的质量相对来说应该都还不错，我个人更倾向于第二个，生成的内容更容易理解，尤其是一些名词确实不懂，还会给一个名词解释。

第二个提问，我给了AI一个极其具体的人设——我的角色、我的困境、我的资源、我的目标。AI不再需要去“扮演”一个空洞的讲师，而是直接进入了“辅导一个资源有限的创业小白”这个具体的场景。它给出的答案，不再是放之四海而皆准的“正确的废话”，而是一份可以立刻打印出来、贴在墙上执行的行动计划。

当然，这招也有翻车的时候。人设法和角色设定这两种都可以尝试尝试。

如果说逆向提示词，就是让模仿变得高效，那人设法是让你和AI的沟通变的精准。

“人设法”是精准打击，它通过定义“你是谁”，来让AI给出最适合你的答案。而“逆向提示词”是风格复刻，它能“偷”来任何你想要的文字风格，让你的内容生产力爆表！