今天(2024年04月30日)早些时候,OpenAI官宣ChatGPT Plus支持了记忆功能。使用起来也非常简单,开启一个新会话后,告诉ChatGPT需要记忆哪些内容就可以。
但是这个功能具体是怎么实现的呢?真实原理,我肯定也不知道,但是通过OpenAI目前开放的API能力,结合巧妙的方案设计,理论上确实是可以实现的,下面就来讲讲我的实现方案。
与会话上下文的区别
- 我们知道在使用ChatGPT或其他AI会话工具时,通过携带之前会话记录再次传递给模型,可以实现「短时记忆」,实现流畅的多轮会话。但是传递给模型的内容终究是有限,虽然这个限制在不断的增长(GPT3.5默认是4K,GPT4现在可以达到128K,国内的模型可以更长)。不过这些都只能算作是「短时记忆」,因为不论多长,超过这个长度,AI就会“忘记”。
- 所以我们这里讨论的并不是「短时记忆」,而是可以永久记住的,不会丢失的,不受模型上下文长度限制的「长时记忆」。
背景知识
实现「长时记忆」只需要使用到OpenAI的Assistant API,此API相比之前的Completions API不同在于,其创建的「assistant智能助手」有永久保存的状态,只需要传递assistant id 就可以重复调用,不需要重新构建对其的提示。
根据OpenAI关于Assistant API文档,我们知道Assistant API可以调用三种工具,分别是:file_search、code_interpreter和function_call。
- file_search:官方实现的工具,上传文档后可以让智能助手依据文档资料回复问题。
- code_interpreter:官方实现的工具,可以让智能助手在一个虚拟环境中运行Python代码,并根据代码执行结果回复问题。
- function_call:允许用户自定义一系列外部工具,供智能助手调用,并根据外部工具的结果回复问题。
我们的实现方案就是:整合file_search和function_call 这两个工具。接下来让我们来看看具体的实现原理:
实现原理
1、使用function_call工具定义一个「请记住」的外部工具,此工具的作用是将需要记忆的内容保存到本地的一个文档中。
{
"type": "function",
"function": {
"name": "please_remember",
"description": "此函数工具可以将用户需要你记住的内容,写入到一个文件中。当用户需要让你记住任何事情的时候,可以调用此函数。",
"parameters": {
"type": "object",
"properties": {
"content": {
"type": "string",
"description": "用户想要你记住的具体内容。"
}
},
"required": ["content"]
}
}
}2、按照一定规则(比如每天定时)将这个文档上传,并附加给指定的assistant智能助手,作为其回复问题的检索资料。
类人模拟
是不是很简单,其实这个过程也是类人模拟的过程。假如,别人让你记住一个内容:
- 你可以随口答应记住了,但是随后可能会忘记(短时记忆)。
- 也可以记录在笔记本中,然后随后有人问答这个问题的时候,翻阅一下笔记本来查询一下(长时记忆)。只不过AI在做查询的时候,是非常快的。
结语
如果你对此也感兴趣,欢迎评论交流。
