这款 Gemini 1.5 Pro 驱动的免费应用,会给你的科研带来什么样的帮助?
我在得到开设视频课,讲授如何用 AI 辅助读写论文后,看到过读者提问:
王老师,能否讲讲如何对多篇文献进行综合分析回顾呢?
那今天咱们就来谈一谈这个问题。首先我给你介绍一下咱们准备使用的工具。
探索
今年 1 月份,我和涂子沛老师见面聊天时,他问了我一个问题:树义,你有没有关注过 Google 的那款知识管理产品?
当时我有点懵,回答道:Google 的知识管理产品?是 Google Keep 吗?
他说不是,是最近结合大语言模型的那个。
我当时没反应过来,但涂老师稍微提示了一下,我就突然明白过来了。其实这款应用我不仅关注了,还专门做了笔记。当场我翻找 Heptabase 笔记,很快找到了。
我给涂老师展示了一下这则笔记,问:您说的是不是这个 Google NotebookLM?我还特意给他看了时间戳,是 2023 年 12 月份的记录下来的。
只不过,这则笔记只能证明我关注过这款 NotebookLM 应用,但其实当时我并不看好它。原因很简单 —— 彼时它不支持中文,对我这样经常处理中文的用户来说,用处着实受限。
但我后来还真用过 NotebookLM ,用途是处理英文长文档。最典型的例子是今年 2 月份的 Sora 发布,我很快也写了一篇论文。目前还是网络首发状态,而 CNKI 上下载量已经超过 2000 了。
在写论文过程中,我们当然需要查资料。Sora 的几篇相关文档和论文都比较长,于是把它们交给了 NotebookLM。例如当时针对信源,我提出了问题:「请总结一下 Sora 的新结构」,NotebookLM 回答说「Sora 的新型架构将变压器操作应用于时空补丁,使其能够生成持续时间、分辨率和宽高比可变的视频和图像」。
看到这里,你可能会觉得 NotebookLM 可以处理中文啊,而且处理得还挺好嘛。但其实这是因为我用了一个叫做 Immersive Translate 的插件,它可以把网页上的所有内容对照翻译成中文而已。
写完这篇文章后,我基本上就把 NotebookLM 扔到一边了。毕竟在更多的日常情境下,我需要使用到能够认得中文的大语言模型嘛。
升级
好在这次是大升级,Google 把 NotebookLM 升级成由 Gemini 1.5 Pro 驱动。
Gemini 1.5 Pro 这款模型你应该并不陌生,因为前些日子 我刚给你演示过用它来看视频写小小说。
在那篇文章里,我给你演示过这款大语言模型的中文能力很强,尤其是 100 万 token 的上下文窗口,大海捞针信息搜寻依然准确,非常惊艳。
而因为 NotebookLM 换成了 Gemini 1.5 Pro ,于是中文处理就不再是问题了。加上它支持长上下文还免费,NotebookLM 的价值就立即突显出来了。
下面咱们用多篇文献一起放进去,做个测试。
测试
我在这里使用了 4 篇文献,来测试 NotebookLM 新版是否好用。这 4 篇文献分别为:
- ChatGPT给科研工作者带来的机遇与挑战
- 图数据库驱动的知识管理应用特性对比研究——以Roam Research为例
- AIGC时代的科研工作流:协同与AI赋能视角下的数字学术工具应用及其未来
- 面向科研工作赋能的笔记类个人知识管理工具研究
这都是我近 3 年内发表的论文。有跟 AI 相关,有的涉及知识管理工具。
我把这四篇论文一股脑儿输入进 NotebookLM ,作为来源文献。然后咱们把 4 个文献都勾选上,并且开始提问,让它综合分析。
提问
我提的第一个问题是「详细说明来源文献中论述的人脑记忆缺陷的问题」。NotebookLM 直接定位到《面向科研工作赋能的笔记类个人知识管理工具研究》这篇文章,找寻其中讨论的人脑记忆缺陷问题。
答案中提到文章指出「人脑在某些情况下会发生信息过载」,「认知负荷」等,并且说明在第 652 页。然后提到「过载会影响选择与处理,导致信息规避」。NotebookLM 还自动用黑体标示了重要词汇,非常有意思。
每一条答案后的页码,都可以看出这些答案有依据,不是凭空捏造的。文章还提到了「信息偶遇」,可以「被动唤醒记忆」。这都与记忆缺陷相关。
于是我又问了第二个问题:「详细说明来源文献中论述的 AI 赋能的问题」。
这次 NotebookLM 首先找到了《AIGC 时代的科研工作流:协同与 AI 赋能视角下的数字学术工具应用及其未来》一文,因为这篇文章和主题最为相近,也确实有 3 条答案都出自该文。但值得注意的是,NotebookLM 列出的答案又不仅仅来自于单一文献,还包括「大幅提升工作效率,缩短研究成果生产周期」,这来自《ChatGPT 给科研工作者带来的机遇与挑战》一文的第 115 页。这充分证明了 NotebookLM 检索资料时候的综合能力。
最有意思的是最后还有一个小节。NotebookLM 提到《面向科研工作赋能的笔记类个人知识管理工具研究》,指出「这一篇文献主要关注图数据库驱动的知识管理工具特性,没有专门论述 AI 赋能问题」。
既然没有,为什么要列出?因为这虽然不是 AI 赋能,但它指出「这些特性可以显著提升知识管理工具的能力范围」,这依然是赋能嘛。有意思。
我又提出了第三个问题,意图正在于综合分析:
以科研人员的实际需求来说,目前 AI 和技术工具可以在哪些环节提升效率?在哪些环节和任务上还有欠缺?」
NotebookLM 首先回答了提升部分问题。这里首先拿出来《ChatGPT 给科研工作者带来的机遇与挑战》一文,提到了编程、阅读和写作等方面 AI 提升效率的方式,并且都给出来了页码。
接下来是不足之处。还是在同一篇文献中,NotebookLM 提到「回答的真实性问题」、「数据污染问题」、「隐私和数据安全问题」,也都有页码标示。
这还没完,NotebookLM 继续说,在《AIGC 时代的科研工作流:协同与 AI 赋能视角下的数字学术工具应用及其未来》一文中,论述了「AI 工具目前不能找寻关键问题、形成最终决策」。还来了一句「换言之」:
AI 工具可以作为辅助工具提升科研效率,但不能代替科研人员的思考和判断」。
我觉得 NotebookLM 总结得非常好。如果我在课堂上提问时,学生能答得这么条理清晰,并能提供充足的证据,我肯定会判断他事先做了功课…… 或者使用了 NotebookLM,哈哈。
另外请注意,NotebookLM 每次给出的答案,都可以作为笔记起来,作为你后续问答的来源(source),你也可以对其进行编辑处理。这样你就可以用滚雪球的方式,积攒自己的个性化问题与思考答案了。
发现
我是怎么发现 NotebookLM 这次大升级呢? OpenAI 发布的 GPT-4o 模型实在太吸引眼球了,所以大家可能忘了第二天还有个重要事件,那就是 Google I/O 2024。
我就是在主题演讲中发现的。演讲者演示了 NotebookLM 的功能,看完后我不知道应该用眼前一亮,还是眼前一黑来形容。
演示的内容,是 NotebookLM 未来将会支持的多模态。它能干什么呢?
你把资料堆进来,它自己根据这些资料总结,并且根据你的需求,设定专属讲述方案。而且还是用两个人对话的方式(类似于对口相声),来给你进行寓教于乐形式的语音讲解。
这还不算,你还可以选择「加入」,进行语音提问。演讲者演示的,是让 NotebookLM 给他的儿子讲牛顿力学,指明要求用篮球为例子,因为孩子喜欢篮球。于是 NotebookLM 立即就开始了讲解,非常生动,而且让学习者感受到了关注和鼓励。
从前我们提到的「第二大脑」,往往是指把你的笔记合理积攒和组织起来,然后你可以跟它「对话」。但是从前所谓的对话,还仅仅是去阅读浏览思索,进而补充内容,链接卡片,扩展补充,阐释输出…… 但是现在,你真的可以和自己的「第二大脑」对话了,用语音。甚至将来,很可能你的表情也会被 AI 准确识别,从而在你一颦一笑中,给你不同的讲解方式和辅导。
你明白我为什么眼前一亮了吧?因为很有可能,这将带来低成本个性化的学习辅导,以及「母慈子孝」的家庭环境。
但是我为什么会眼前一黑呢?因为你别忘了,我自己的职业是教师啊。😂
让我跟大语言模型比耐心、学习能力?别说这些了,就连说多少话嗓子都不会痛这点儿,我就不是它对手啊。
小结
本文我给你介绍了用 NotebookLM 这款免费应用综合分析多篇中文文献,回答用户具体问题,并且给出足够扎实原文证据的方法。我非常建议你动手尝试一下 NotebookLM ,也建议你认真看看 Google I/O 2024 的全部 Keynote 视频,感受一下「未来已来」的冲击。
不过目前 NotebookLM 还没有正式推出多模态功能给普通用户,咱们还得再等等。另外,如果你希望不必每次都上传内容给 NotebookLM 进行分析,咱们还可以 直接构建本地版的 AI 第二大脑。
如果你觉得本文有用,请充电。
如果本文可能对你的朋友有帮助,请转发给他们。
欢迎关注我的专栏「科研利器」,以便及时收到后续的更新内容。
点击这个链接加入少数派会员,立享 9 折优惠!获得专属会员内容、会员播客以及会员定制周边。在更多的领域和方向帮你打开脑洞,找到新的兴趣点。与少数派一起洞悉当下,探索新知。