ChatGPT“记忆”功能原理解密

今天（2024年04月30日）早些时候，OpenAI官宣ChatGPT Plus支持了记忆功能。使用起来也非常简单，开启一个新会话后，告诉ChatGPT需要记忆哪些内容就可以。

但是这个功能具体是怎么实现的呢？真实原理，我肯定也不知道，但是通过OpenAI目前开放的API能力，结合巧妙的方案设计，理论上确实是可以实现的，下面就来讲讲我的实现方案。

与会话上下文的区别

我们知道在使用ChatGPT或其他AI会话工具时，通过携带之前会话记录再次传递给模型，可以实现「短时记忆」，实现流畅的多轮会话。但是传递给模型的内容终究是有限，虽然这个限制在不断的增长（GPT3.5默认是4K，GPT4现在可以达到128K，国内的模型可以更长）。不过这些都只能算作是「短时记忆」，因为不论多长，超过这个长度，AI就会“忘记”。
所以我们这里讨论的并不是「短时记忆」，而是可以永久记住的，不会丢失的，不受模型上下文长度限制的「长时记忆」。

背景知识

实现「长时记忆」只需要使用到OpenAI的Assistant API，此API相比之前的Completions API不同在于，其创建的「assistant智能助手」有永久保存的状态，只需要传递assistant id 就可以重复调用，不需要重新构建对其的提示。

根据OpenAI关于Assistant API文档，我们知道Assistant API可以调用三种工具，分别是：file_search、code_interpreter和function_call。

file_search：官方实现的工具，上传文档后可以让智能助手依据文档资料回复问题。
code_interpreter：官方实现的工具，可以让智能助手在一个虚拟环境中运行Python代码，并根据代码执行结果回复问题。
function_call：允许用户自定义一系列外部工具，供智能助手调用，并根据外部工具的结果回复问题。

我们的实现方案就是：整合file_search和function_call 这两个工具。接下来让我们来看看具体的实现原理：

实现原理

1、使用function_call工具定义一个「请记住」的外部工具，此工具的作用是将需要记忆的内容保存到本地的一个文档中。

    {
      "type": "function",
      "function": {
        "name": "please_remember",
        "description": "此函数工具可以将用户需要你记住的内容，写入到一个文件中。当用户需要让你记住任何事情的时候，可以调用此函数。",
        "parameters": {
          "type": "object",
          "properties": {
            "content": {
              "type": "string",
              "description": "用户想要你记住的具体内容。"
            }
          },
          "required": ["content"]
        }
      }
    }

2、按照一定规则（比如每天定时）将这个文档上传，并附加给指定的assistant智能助手，作为其回复问题的检索资料。

类人模拟

是不是很简单，其实这个过程也是类人模拟的过程。假如，别人让你记住一个内容：

你可以随口答应记住了，但是随后可能会忘记（短时记忆）。
也可以记录在笔记本中，然后随后有人问答这个问题的时候，翻阅一下笔记本来查询一下（长时记忆）。只不过AI在做查询的时候，是非常快的。

结语

如果你对此也感兴趣，欢迎评论交流。