如何用 NotebookLM 综合分析多篇文献？

这款 Gemini 1.5 Pro 驱动的免费应用，会给你的科研带来什么样的帮助？

我在得到开设视频课，讲授如何用 AI 辅助读写论文后，看到过读者提问：

王老师，能否讲讲如何对多篇文献进行综合分析回顾呢？

那今天咱们就来谈一谈这个问题。首先我给你介绍一下咱们准备使用的工具。

探索

今年 1 月份，我和涂子沛老师见面聊天时，他问了我一个问题：树义，你有没有关注过 Google 的那款知识管理产品？

当时我有点懵，回答道：Google 的知识管理产品？是 Google Keep 吗？

他说不是，是最近结合大语言模型的那个。

我当时没反应过来，但涂老师稍微提示了一下，我就突然明白过来了。其实这款应用我不仅关注了，还专门做了笔记。当场我翻找 Heptabase 笔记，很快找到了。

我给涂老师展示了一下这则笔记，问：您说的是不是这个 Google NotebookLM？我还特意给他看了时间戳，是 2023 年 12 月份的记录下来的。

只不过，这则笔记只能证明我关注过这款 NotebookLM 应用，但其实当时我并不看好它。原因很简单 —— 彼时它不支持中文，对我这样经常处理中文的用户来说，用处着实受限。

但我后来还真用过 NotebookLM ，用途是处理英文长文档。最典型的例子是今年 2 月份的 Sora 发布，我很快也写了一篇论文。目前还是网络首发状态，而 CNKI 上下载量已经超过 2000 了。

在写论文过程中，我们当然需要查资料。Sora 的几篇相关文档和论文都比较长，于是把它们交给了 NotebookLM。例如当时针对信源，我提出了问题：「请总结一下 Sora 的新结构」，NotebookLM 回答说「Sora 的新型架构将变压器操作应用于时空补丁，使其能够生成持续时间、分辨率和宽高比可变的视频和图像」。

看到这里，你可能会觉得 NotebookLM 可以处理中文啊，而且处理得还挺好嘛。但其实这是因为我用了一个叫做 Immersive Translate 的插件，它可以把网页上的所有内容对照翻译成中文而已。

写完这篇文章后，我基本上就把 NotebookLM 扔到一边了。毕竟在更多的日常情境下，我需要使用到能够认得中文的大语言模型嘛。

升级

好在这次是大升级，Google 把 NotebookLM 升级成由 Gemini 1.5 Pro 驱动。

Gemini 1.5 Pro 这款模型你应该并不陌生，因为前些日子我刚给你演示过用它来看视频写小小说。

在那篇文章里，我给你演示过这款大语言模型的中文能力很强，尤其是 100 万 token 的上下文窗口，大海捞针信息搜寻依然准确，非常惊艳。

而因为 NotebookLM 换成了 Gemini 1.5 Pro ，于是中文处理就不再是问题了。加上它支持长上下文还免费，NotebookLM 的价值就立即突显出来了。

下面咱们用多篇文献一起放进去，做个测试。

测试

我在这里使用了 4 篇文献，来测试 NotebookLM 新版是否好用。这 4 篇文献分别为：

ChatGPT给科研工作者带来的机遇与挑战
图数据库驱动的知识管理应用特性对比研究——以Roam Research为例
AIGC时代的科研工作流：协同与AI赋能视角下的数字学术工具应用及其未来
面向科研工作赋能的笔记类个人知识管理工具研究

这都是我近 3 年内发表的论文。有跟 AI 相关，有的涉及知识管理工具。

我把这四篇论文一股脑儿输入进 NotebookLM ，作为来源文献。然后咱们把 4 个文献都勾选上，并且开始提问，让它综合分析。

提问

我提的第一个问题是「详细说明来源文献中论述的人脑记忆缺陷的问题」。NotebookLM 直接定位到《面向科研工作赋能的笔记类个人知识管理工具研究》这篇文章，找寻其中讨论的人脑记忆缺陷问题。

答案中提到文章指出「人脑在某些情况下会发生信息过载」，「认知负荷」等，并且说明在第 652 页。然后提到「过载会影响选择与处理，导致信息规避」。NotebookLM 还自动用黑体标示了重要词汇，非常有意思。

每一条答案后的页码，都可以看出这些答案有依据，不是凭空捏造的。文章还提到了「信息偶遇」，可以「被动唤醒记忆」。这都与记忆缺陷相关。

于是我又问了第二个问题：「详细说明来源文献中论述的 AI 赋能的问题」。

这次 NotebookLM 首先找到了《AIGC 时代的科研工作流：协同与 AI 赋能视角下的数字学术工具应用及其未来》一文，因为这篇文章和主题最为相近，也确实有 3 条答案都出自该文。但值得注意的是，NotebookLM 列出的答案又不仅仅来自于单一文献，还包括「大幅提升工作效率，缩短研究成果生产周期」，这来自《ChatGPT 给科研工作者带来的机遇与挑战》一文的第 115 页。这充分证明了 NotebookLM 检索资料时候的综合能力。

最有意思的是最后还有一个小节。NotebookLM 提到《面向科研工作赋能的笔记类个人知识管理工具研究》，指出「这一篇文献主要关注图数据库驱动的知识管理工具特性，没有专门论述 AI 赋能问题」。

既然没有，为什么要列出？因为这虽然不是 AI 赋能，但它指出「这些特性可以显著提升知识管理工具的能力范围」，这依然是赋能嘛。有意思。

我又提出了第三个问题，意图正在于综合分析：

以科研人员的实际需求来说，目前 AI 和技术工具可以在哪些环节提升效率？在哪些环节和任务上还有欠缺？」

NotebookLM 首先回答了提升部分问题。这里首先拿出来《ChatGPT 给科研工作者带来的机遇与挑战》一文，提到了编程、阅读和写作等方面 AI 提升效率的方式，并且都给出来了页码。

接下来是不足之处。还是在同一篇文献中，NotebookLM 提到「回答的真实性问题」、「数据污染问题」、「隐私和数据安全问题」，也都有页码标示。

这还没完，NotebookLM 继续说，在《AIGC 时代的科研工作流：协同与 AI 赋能视角下的数字学术工具应用及其未来》一文中，论述了「AI 工具目前不能找寻关键问题、形成最终决策」。还来了一句「换言之」：

AI 工具可以作为辅助工具提升科研效率，但不能代替科研人员的思考和判断」。

我觉得 NotebookLM 总结得非常好。如果我在课堂上提问时，学生能答得这么条理清晰，并能提供充足的证据，我肯定会判断他事先做了功课…… 或者使用了 NotebookLM，哈哈。

另外请注意，NotebookLM 每次给出的答案，都可以作为笔记起来，作为你后续问答的来源（source），你也可以对其进行编辑处理。这样你就可以用滚雪球的方式，积攒自己的个性化问题与思考答案了。

发现

我是怎么发现 NotebookLM 这次大升级呢？ OpenAI 发布的 GPT-4o 模型实在太吸引眼球了，所以大家可能忘了第二天还有个重要事件，那就是 Google I/O 2024。

我就是在主题演讲中发现的。演讲者演示了 NotebookLM 的功能，看完后我不知道应该用眼前一亮，还是眼前一黑来形容。

演示的内容，是 NotebookLM 未来将会支持的多模态。它能干什么呢？

你把资料堆进来，它自己根据这些资料总结，并且根据你的需求，设定专属讲述方案。而且还是用两个人对话的方式（类似于对口相声），来给你进行寓教于乐形式的语音讲解。

这还不算，你还可以选择「加入」，进行语音提问。演讲者演示的，是让 NotebookLM 给他的儿子讲牛顿力学，指明要求用篮球为例子，因为孩子喜欢篮球。于是 NotebookLM 立即就开始了讲解，非常生动，而且让学习者感受到了关注和鼓励。

从前我们提到的「第二大脑」，往往是指把你的笔记合理积攒和组织起来，然后你可以跟它「对话」。但是从前所谓的对话，还仅仅是去阅读浏览思索，进而补充内容，链接卡片，扩展补充，阐释输出…… 但是现在，你真的可以和自己的「第二大脑」对话了，用语音。甚至将来，很可能你的表情也会被 AI 准确识别，从而在你一颦一笑中，给你不同的讲解方式和辅导。

你明白我为什么眼前一亮了吧？因为很有可能，这将带来低成本个性化的学习辅导，以及「母慈子孝」的家庭环境。

但是我为什么会眼前一黑呢？因为你别忘了，我自己的职业是教师啊。😂

让我跟大语言模型比耐心、学习能力？别说这些了，就连说多少话嗓子都不会痛这点儿，我就不是它对手啊。

小结

本文我给你介绍了用 NotebookLM 这款免费应用综合分析多篇中文文献，回答用户具体问题，并且给出足够扎实原文证据的方法。我非常建议你动手尝试一下 NotebookLM ，也建议你认真看看 Google I/O 2024 的全部 Keynote 视频，感受一下「未来已来」的冲击。

不过目前 NotebookLM 还没有正式推出多模态功能给普通用户，咱们还得再等等。另外，如果你希望不必每次都上传内容给 NotebookLM 进行分析，咱们还可以直接构建本地版的 AI 第二大脑。

具体方法请参考这篇文章。

如果你觉得本文有用，请充电。

如果本文可能对你的朋友有帮助，请转发给他们。

欢迎关注我的专栏「科研利器」，以便及时收到后续的更新内容。

点击这个链接加入少数派会员，立享 9 折优惠！获得专属会员内容、会员播客以及会员定制周边。在更多的领域和方向帮你打开脑洞，找到新的兴趣点。与少数派一起洞悉当下，探索新知。

如何用 NotebookLM 综合分析多篇文献？

探索

升级

测试

提问

发现

小结

延伸阅读