在前面几篇我分别讲解了GPT的基本使用、高阶技巧GPTs的创建。GPTs确实很好用,当我们预设好prompt,可以创建一个个专属的、定向输出的GPT助手。然而,我在使用GPTs的过程中遇到了一个问题:每次使用自己创建的GPTs时,输出的结果仍存在随机性,难以保证一致的格式和风格。这增加了我对预设Prompt的顾虑,我开始的时候怀疑是因为我的Prompt定义的不够清楚,开始反复调试,并针对输出格式做三令五申般的限制,但在测试中仍然发现GPT的输出具有不稳定性。

为了应对这一问题,我琢磨出了一种名为“窗口定向策略”的方法。哈哈,这个名字一听就很专业,或许其实已经有人发现了这点,但我在大量的翻阅关于国内外的网站并未找到相关的说法,我便自己给它起了个名字。其实原理很简单,通过在一个GPTs窗口内确定完美输出格式并作为样本窗口,持续测试并逐步完善它输出,你会发现这样可以显著提升文本生成的稳定性和一致性,从而优化使用体验。本文将详细介绍GPTs的基础概念、使用过程中遇到的问题、窗口定向策略的定义和操作步骤,以及该策略的具体优势和实操案例。

GPTs的工作原理

GPTs是OpenAI推出的一项功能,说白了就是让用户可以创建和定制自己的AI助手,帮助解决各种具体的问题。就像有一个专家团队随时待命,帮你处理不同领域的棘手事情。这功能的核心其实就是预设Prompt,类似于你定义助手:“今天你是我的客服助手,需要帮助我回答客户的常见问题。”然后这个助手就会根据你的要求,以定义的客服角色做定向输出。

GPT的工作原理有点像我们平时聊天一样,靠的是自然语言理解(NLU)和自然语言生成(NLG)技术。先是通过大量阅读和学习各种语言模式,掌握了很多语言知识,然后利用这些知识来理解你给出的提示词和输入信息,再生成合适的回应。就像你和朋友说:“解释一下机器学习是什么”,你的朋友可能会回答:“机器学习就是让计算机从数据中学习的技术”,也可能会说:“机器学习是通过训练算法来做预测的方法”。这种灵活性让对话变得更有趣,但同时却确实有一定的随机性。虽然这些提示词是你预设好的,但因为这种随机性,每次响应可能都会有所不同。你可以通过调试提示词、提供更多的示例数据和指令,来提高输出的一致性。具体来说,你不断优化提示词,加入更多细节和上下文信息,就像和朋友说话一样,多聊几次,对方自然会更懂你。

在实际应用中,GPT助手就像是个不断学习和进步的朋友。你的反馈对它非常重要,能帮助它更好地理解和调整。例如,你发现某些回答不准确或不符合预期,可以通过具体的反馈来指导它进行调整。随着它不断接收到新的示例数据和指令,生成能力也会逐步提升,更加适应你的需求,但你要清楚这仅仅只存在于当前窗口...

窗口效应

在我的日常使用中逐渐发现这个问题,GPTs的初始响应的输出结果有时候大同小异,会在格式、风格、调性和内容生成几个维度不固定的发生偏差。这种初始随机性给我的使用带来了不少麻烦:

  • 输出结果不一致:在需要多次生成类似内容的场景中,文本的格式和风格难以保持一致,增加了后期编辑的工作量。
  • 重复劳动:为了得到预期的结果,我不得不多次新开窗口,浪费大量时间和精力。
  • 用户体验下降:频繁的随机性输出让我对GPT的可靠性产生了质疑。

我在使用某一个GPT做需求时,发现它生成的内容总是和我设定的前置条件不符,甚至多次偏离我的预期。每次看到结果,都让我有点哭笑不得。比如,我让它写一篇关于技术发展的文章,风格应该是专业的,结果它给我写了一段像诗一样的文字,虽然挺有趣,但完全不是我想要的。

于是,我开始翻查以往的成功记录,决定从之前效果不错的窗口中继续提出新的需求。神奇的是,在旧窗口中的输出又符合了我的预期!在之前的窗口中继续提出需求,GPT生成的内容开始变得稳固,风格和格式也越来越接近我的预期。这让我意识到,也许GPT的记忆功能在窗口间起了作用。

随着进一步测试,我发现了GPTs的一个“BUG”:在前置条件完善的情况下,同一个GPT在不同窗口生成的结果会有明显偏差。通过对比,我注意到在原有窗口中,GPT能够利用之前的上下文信息,更好地保持一致性;而新开窗口则像是清空了记忆,生成的内容往往变得随机。


GPTs初始响应测试

而后我找到了之前创建的一个GPTs,当时是为了给批量生图SOP工程做节点提效用的,叫“批量生图 CSV条目助手“。感兴趣的同学可以去看详细的应用场景介绍,我在这儿大概的说下我所预期的输出:根据我提供的具体语言描述提取主要元素,并根据我预设的规范,以代码块的形式(csv)产出。

*图像名称(内容),图像具体关键词,不希望图像里有什么,是否需要GPT扩写关键词,是否智能抠图,图像尺寸宽,图像尺寸高,图片预生成数量(1-10)

*每个部分中间以英文逗号隔开,每个部分中各字段可以中文逗号做隔开,默认关闭GPT扩写和智能抠图,默认尺寸宽&高为1024,生成数量为1。

所以我所期望的输出是以代码块的格式支持一键复制,快速将产出条目转移至PyCharm中做csv填充。但是在测试中会发现每次格式都不一样:

该测试中,同一个GPTs,同一个请求,输出的格式完全不同。只有第五种类型中使用了标准的arduino代码块形式输出,无多余的描述,并在代码块中也没有赘述一遍格式,因此可以点击右上角的“复制代码”直接使用。在新开的12个窗口中仅有四次达到预期,尽管测试的次数少,但是也足以说明问题。初始响应具备随机性,很多人就好奇了,什么是初始响应?而我为什么又一直在强调“初始”,这也和之后我要说的“窗口定向”策略相关,姑且称之为“窗口效应”吧。在同一个窗口中,在第一次响应用户请求时所输出的内容会被作为初始数据反哺给模型作为训练的数据集。换句话说,在模型第一次响应时的输出会被作为样本,从而导致后续的输出以初始样本为模板,所输出的内容以之前的对话为数据支撑,这也是模型所具备的联系上下文的记忆功能。

我以类型三和类型五作为对比测试:

类型三:输出格式错误

 

类型五:达到预期

可以看到,当我在同一个GPTs中,使用同样的请求时,不同的窗口输出的格式依旧按照初始响应的输出风格而输出。所以当初始响应未达到预期时,后续调整起来就费劲了,倒也不是不能把它调试正确,这就好比去调整一个人的认知,不是不能改,只是需要费很大功夫。所以不如直接删掉,重新开一个窗口。

“窗口定向”策略

窗口定向策略1,其实就是在一个达到预期的对话窗口内逐步巩固GPT的输出,让它能在连续的对话中积累上下文信息,减少随机性。简单来说,这个策略就像是在给一个空白的大脑不断填充记忆,并通过调整这些记忆来固定输出风格/格式。

这个策略的核心在于:

上下文积累:在同一个对话窗口内进行多轮对话,GPT能够记住之前的上下文信息,保持输出的一致性。

逐步优化:通过不断调整和优化提示语,引导GPT生成符合预期的结果。

避免频繁新开窗口:每次新开窗口就像是大脑重启,之前的上下文信息都没了,导致输出结果的随机性增加。

窗口定向策略的实操技巧

第一步:多次测试确定符合预期的输出框架

如果第一次模型响应的输出就符合你的需求当然最好,直接跳到第三步即可。

红色框内为“批量生图CSV条目助手”窗口多轮测试

第二步:逐步完善输出框架和风格

经过多轮测试,窗口2为最终预期窗口。在窗口内进行多轮对话,每次生成文本后,根据结果进行微调,逐步引导GPT生成符合预期的结果。

不同的请求形式巩固输出风格和形式

有时即便GPTs 的初始响应符合预期,但是随着之后的不断请求也会出现不一致的格式输出,这时候就需要人工调试了,告诉它什么是正确的输出,请继续保持,什么是错误的,请清除该部分记忆。这里就可以用到一个小技巧,可以选择它输出的内容,会出现一个引号,即为引用的效果,可以局部调试窗口的记忆。

选择“引用”局部调试,自然语言描述

第三步:重命名和整理窗口,持续利用上下文能力

当对输出结果满意后,将窗口重命名并整理,方便后续使用。保持在同一个窗口内继续进行对话,GPT能够利用之前的上下文信息,持续输出一致且稳定的结果。

可以看出我已经基本会给每个窗口做具体的命名处理,同学们不一定需要按照我的格式去命名,这个是随意的,只要方便你去调用即可。而且请记住GPT的历史记录只保留窗口30天,所以如果一定要记得给重要的对话窗口进行归档,可在“设置”中再进行调用。

通过窗口定向策略,GPT的输出一致性显著提升。具体优势如下:

  • 减少随机性:通过固定窗口和上下文积累,GPT能更好地保持输出风格和格式的稳定性。
  • 提升可靠性:多轮对话和逐步优化让GPT能够记住用户的偏好,输出结果更加符合预期。
  • 一致的用户体验:稳定和一致的输出结果提升了用户体验,让使用GPT变得更加得心应手。
  • 减少重复劳动:通过多轮对话和调整,用户可以减少重复尝试的次数,快速得到满意的结果。
  • 节省时间和精力:一致和稳定的输出结果减少了后期编辑的工作量,使用户能够更加专注于核心任务。
  • 提升工作效率:通过优化输出流程,用户可以更高效地完成任务,提高整体工作效率。

总结

窗口定向策略通过在一个窗口内逐步完善GPT的输出,有效提升了文本生成的稳定性和一致性。这一策略不仅减少了输出结果的随机性,提高了可靠性,还显著提升了用户的工作效率。窗口定向策略可以帮助用户更高效地利用GPT的强大功能,所以GPTs不能仅仅依靠预设prompt,也需要一定的示例数据,利用预训练的语言模型和自然语言处理技术去不断巩固输出的内容风格、格式和颗粒度。

尽管每次响应具有一定的多样性,但通过联系上下文的学习能力去持续巩固输出结构,你可以在灵活性和一致性之间找到平衡,“窗口定向“策略可以使GPT助手更好地满足你的特定需求。理解这些工作原理,将帮助你更有效地使用GPTs,实现其最大潜力!