2023 年最具影响力的事情一定是 ChatGPT 发布。ChatGPT,这个由 OpenAI 开发的强大的自然语言处理工具,正在逐渐改变我们获取信息、解决问题和创造内容的方式。它不仅仅是一个工具,更是一个伙伴,一个可以协助我们完成各种任务的虚拟团队成员。在过去一年里,ChatGPT 在我的世界里,一人分饰多角,他是无所不知的百事通,是任劳任怨的最强文秘,还是灵感不断的点子王。在和 ChatGPT 相处的过程中,我也琢磨出使用 ChatGPT 的技巧。在这篇文章中,我将分享如何充分挖掘 ChatGPT 的能力,让其成为个人或团队的得力助手。
ChatGPT 简要介绍
在正式介绍如何使用 ChatGPT 之前,我想要先梳理下基本的概念:GPT、ChatGPT、OpenAI、OpenAI API 之间有什么区别。
GPT 是生成式预训练模型(Generative Pre-trained Transformer)的缩写,GPT 与 ChatGPT 之间的区别,有点类似于底层的安卓技术和各大手机厂商的手机系统。安卓是一种手机系统技术,但是这个系统,普通人不能直接使用,需要将其包装成安卓系统。OpenAI 是开创 GPT 技术的公司,除了开发 GPT 这种技术,OpenAI 还将 GPT 封装成了普通人也可以使用的 ChatGPT。除了 OpenAI 官方应用 GPT 开发软件,供用户使用,其他公司也使用 GPT 开发了很多软件,比如微软的 Bing Copilot,Quora 开发的 Poe,字节的 Coze 都是基于 OpenAI 的 GPT 技术进行开发的,有点类似于各大手机厂商基于安卓开发自家的手机操作系统,比如小米开发澎拜 OS,底层的技术还是基于安卓系统。
因而,我们如果想要使用 GPT,也不一定非要使用 ChatGPT,有很多其他替代品可以选择。而且这些替代品不乏免费软件,部分软件在国内网络就能正常访问。
我个人就是先使用的 ChatGPT,但是每月 20 美元的花费以及繁琐的充值方式,还是将我劝退。后来开始使用 Poe,但是 Poe 使用 GPT-4 功能需要付费。后来又看到别人推荐 Coze,可以使用 GPT-4 的功能。但是这些不便于国内访问,国内可以使用 Kimi Chat,虽然不是基于 GPT,但使用的也是大模型的技术,效果也很不错,能满足日常使用。
所以在下面文章中关于 GPT 的截图并不是来自一个软件,特此说明。因为使用的软件并不都是 ChatGPT,因此以下都称作 GPT。
数字实习生,潜力无限
在开头,我提到 GPT 是百事通、点子王、编程导师以及文秘,但这些都是我和 GPT 相处一年后共同成长出来的角色。年初,和 GPT 初次见面时,他还只是个青涩的实习生。能力很强,上知天文,下知地理,但干起活来眼高手低。我让他帮我修改文章,他会给我一堆正确的废话;我让他帮我修改一段代码,按照提示修改 3-4 次,还是有 bug;我让他将内容整理成表格,他告诉我他无能为力。
为啥别人盛赞的 GPT,到我手里就无用武之地?后来看到有人说:「用 GPT 要像用实习生一样,任务具体,指令明确。」听到这句话,茅塞顿开。原来,没有发挥出 GPT 的作用,原因在于我的领导能力不行,而不是 GPT 能力不行。
在了解到这一点之后,我就学着如何领导 GPT。说领导 GPT,还是有些偏颇,更多是和 GPT 协同创作。有时候是我告诉他指令,有时候是他教会我解决难题。我们两个相互依赖,共同成长。
那么如何更好的和 GPT 协作呢?人类社会的协作要学习沟通技巧,和 GPT 沟通也一样。只不过,人与人之间的沟通称作语言,而人与 GPT 之间的沟通称作提示词(Prompt)。
学会和实习生好好沟通
其实,我们使用的 GPT 已经内置了一些基本的提示词,如果是简单的问题,我们直接问 GPT,就能得到不错的答案。比如我直接问:「 GPT 是什么的缩写?GPT 和 ChatGPT、GPT3、GPT」。GPT 就能给出详细的答案。
但有时,直接问 GPT,可能不能得到我们想要的结果。比如当我询问 GPT,我可以投稿的期刊并建议他将内容整理为表格时,他说:「对不起,当前我并无法生成表格」。这时,我追加了提示词:“请将上述内容以 markdown 形式整理为表格”。这时,他就明白了我的意思,并将其整理成了表格。为什么在我将提示语增加了 markdown 形式整理为表格时,GPT 就能显示表格了呢?我将在万能文秘段落里详细介绍,现在我们继续看提示词。
为了便于大家更好的掌握提示词,OpenAI 曾发布《GPT 最佳实践/GPT Best Practice》的文档,里面介绍了一些提示词的原则与技巧,具体包括:
- 知道自己要什么,就展开说说
- 给 GPT 发阅读材料
- 把复杂任务拆解成指任务
- 允许 GPT 思考一下
- 借助外部的工具
- 系统地做一些实验
如果你想要详细了解其内容,可以访问官方阅读,或者是阅读国人翻译好的中文版本:OpenAI:GPT 最佳实践中文大白话版本
不过这 6 个提示词原则还是比较多,所以不便于记忆。我在日常中使用较多的是推特博主提出的 RTF 框架,这个框架简洁明了,易于理解和应用。RTF 框架的核心思想是将指令分解为三个关键部分:角色(Role)、任务(Task)和格式(Format)。通过这样的模板给 GPT 指令,可以更有效地引导模型生成我们所需的内容。
角色(R):首先明确你希望 GPT 扮演的角色。这可以是任何角色,比如历史学家、诗人、程序员。角色的设定有助于 GPT 理解它需要以何种身份和风格来回应你的问题。
任务(T):接下来,描述你希望 GPT 执行的具体任务。这可能是回答问题、撰写文章、提供建议,或者是其他任何你希望模型完成的任务。清晰地定义任务可以帮助 GPT 更准确地理解你的需求。
格式(F):最后,指定你希望结果呈现的格式。这可能是列表、段落、诗歌、代码段等。格式的设定有助于 GPT 生成结构化和符合预期的输出。比如前面我让 GPT 以表格的形式整理输出内容。
例如,如果你想要 GPT 帮你写一篇关于人工智能的文章,你可以这样给出指令:
现在你要充当(角色):科技专栏作家
执行(任务):撰写一篇关于人工智能在医疗领域的应用的文章
以这种(格式)显示:文章结构,包括引言、主体(三个主要应用案例)、结论
通过这样的指令,GPT 能够清晰地知道你希望它以科技专栏作家的身份,撰写一篇关于人工智能在医疗领域应用的文章,并以文章的形式呈现,包括引言、主体和结论。这样的 RTF 框架不仅简化了指令的复杂性,还提高了与 GPT 交互的效率和准确性。
实践时,可能任务以及格式更加重要,只有当 GPT 回答的差强人意的时候,我们再制定角色。
自从 GPT 问世以来,也涌现出了源源不断的提示词框架,除了前面的提到的 RTF 框架,还有 React 框架、CoT 框架等等。但其实比学习提示词框架更重要的,是拥有生成提示词框架的能力。
在我实践 GPT 的过程中,就总结出了 CEO 提示词框架,帮助自己理解概念。
百事通,活的百科全书
CEO 提示词框架,可以帮助我们快速进入一个新领域。C 是指概念(Concept),也是指 Compare,E 是指举例(Example),O 是指操作( Operate)。
我们先了解概念的含义,然后将新概念和旧概念进行比较,紧接着让 GPT 举几个具体的例子,最后我们要将自己的理解在反问下 GPT,来确认自己的理解是否正确。下面,我就让 GPT 帮助我们了解下 AI 领域中经常提到的代理(Agent)是什么?Agent 和我们之前理解的 Proxy 代理,又有什么区别?
了解了代理(Agent)的概念以及含义,我们就能够明白为什么 Agent 在人工智能中如此至关重要。现在通用大模型已经有了基础的推理和决策能力,他能够翻译文字,能够总结文本内容,还能够使用通俗的语言转述内容。如果我们能够将他上面的能力串联起来,那我们就拥有了一个 24 小时工作的科普作家。当然,这是最为理想的情况,实际使用时,可能会遇到翻译的内容很机械,概括的内容有偏颇,转述的内容不通俗。如何能够保证 GPT 保质保量的完成工作,就需要很好的设计 Agent 代理。
设计好的 Agent 费时费力,但是执行一些简单、重复的工作,GPT 还是很擅长。那接下来,我们就来看看如何培养 GPT 当个好秘书。
万能文秘,任劳任怨
格式转化器
工作中,很多时候需要将文本内容,整理为表格,便于对数据进一步处理,或者是放在幻灯片里面,进行展示。之前,都是需要手动整理,现在可以让 GPT 帮忙代劳了。比如我需要整理下手表测试最大摄氧量的准确性,只需要把文字发给 GPT,他就帮我整理成表格了。
不过,这里将单位放在了表格正文中,我们追加一条提示词,让 GPT 将单位放到标题当中。
现在,我们来揭秘下前面提到的内容,GPT 为什么有时候能输出表格,有时候又不能输出表格呢?其实从本质上来讲,GPT 并不能输出表格,他只能输出纯文字。GPT 本身输出的内容,其实如下面所示,没有表格外框,就是用|
、-
区分文字。而这种格式呢,其实是一种 Markdown 格式,后期的 ChatGPT 会再将其渲染表格。这也是为什么在我说以 markdown 形式展示表格时,就能呈现为表格了。Markdown 是一种轻量级标记语言,使用一些简单的符号就可以实现基本的格式化,如井号 # 表示一级标题,表示加粗 。借助 Markdown 语法,我们甚至可以用 GPT 绘图。
绘图神器
这段话的表述基本上是清晰的,但可以稍作调整以增强连贯性和详细性。以下是修改后的版本:
在使用 GPT 进行绘图时,我们通常会借助 Mermaid 这个工具。Mermaid 是一个基于 JavaScript 的绘图库,它允许我们通过编写类似 Markdown 的简洁语法来快速创建各种图表和流程图。例如,我最近尝试了让 GPT 帮助我整理赫伯特·西蒙的生平,并将其转换为时间线。为了实现这一点,我在提示语中特别指定了使用 Mermaid 格式进行输出。GPT 根据我的指示生成了文本,然后我将这段文本粘贴到了支持 Mermaid 的编辑器 Typora 中。在 Typora 的渲染下,西蒙的生平被转换成了一个清晰的时间线,这样不仅节省了我手动绘制的时间,还提高了工作效率。下图展示了这个过程的最终结果,你可以在左侧看到 GPT 生成的 Mermaid 代码,而在右侧则是 Typora 渲染出的时间线图表。
除了绘制时间线,Mermaid 还能够绘制流程图、饼图、甘特图,更多内容可以访问 Mermaid 官网进行了解。
Excel 助手
除了整理文本,GPT 还能帮助我们处理 Excel 中的数据,书写 Excel 的公式。之前看到 Excel 中的 Vlook 公式,我就很头大。现在,我就直接描述我的数据,让其帮写好公式。如果我们使用 GPT Plus,那还能够上传 Excel,分析数据更加方便。当然,ChatGPT 的功能远不止这些,GPT 还能帮助我们进行单位转换,统计一段话中人名的数量和出现的次数。总之,生活中反复出现的繁琐工作,都可以寻求 GPT 的帮助。
除了执行繁琐的重复工作,GPT 还是个点子王,激发我们的创意灵感。
点子王,创意不断
对我来讲,文章的开头很难写,常常是文章大纲列出来了,但是不知道从哪里切入到文章正文。现在有了 GPT,写序言更容易。
比如写这篇文章时,我就先把文章大纲扔给 GPT,让他帮我写下文章开头。当然,我也没有当甩手掌柜,照搬全抄袭,对 GPT 内容进行改写,使其更符合我的行文风格。
行文过程中,遇到卡壳的地方,也会让 GPT 对内容进行补充,比如说我不知道如何用通俗的话语表示代偿,就寻求 GPT,启发灵感。再者,写完文章之后,我还会让 GPT 辅助起标题。
GPT 输出的内容,或许不是最终的成品,但是借助 GPT 的内容,我可以跳达我的灵感圣地。
和实习生一起努力
前面介绍了使用 GPT 的技巧,但相比较使用 GPT 的技巧,对待 GPT 的态度更重要。技巧不可穷尽,但了正确的态度,我们可以自己发现、总结出使用技巧。
我们需要像对待实习生一样对待 GPT:清楚的告诉他事情的前因后果,告诉他我们想要得到的结果,耐心的等待他思考。如果思考的答案不满意,要拆解问题,引导他向着正确的方向思考。