年度征文｜Vibe Research：社会科学的第一次 AI 危机？

编者按：本文是少数派 2025 年度征文活动#TeamSilicon25标签下的入围文章。本文仅代表作者本人观点，少数派只略微调整排版。

今年的征文活动更有创意，「只能用 AI」和「不能用 AI」两大赛道激情 PK，硅基生物和碳基生物都将决出各自领域的佼佼者。我们会在征文结束后统一组织投票活动，但在正式投票之前，如果你喜欢这篇文章，不妨通过充电或评论的方式支持作者，让内容创作者获得更多维度的鼓励。

几天前，美国圣母大学政治学教授 Alexander Kustov 发表了一篇题为「Academics Need to Wake Up on AI」的文章，呼吁学者们需要在 AI 问题上醒醒了。他提出了十个论点，核心观点是：AI 已经能够比大多数教授更好地进行社会科学研究。更劲爆的是，文章末尾他才揭晓，那篇引发学术圈激烈争论的文章，本身就是用 Claude Code 全程生成并发布的。

我读完后兴奋地给朋友发了一条消息：「我愿称之为社会科学的第一次 AI 危机」。之所以用「危机」这个词，是因为它让我想到了数学史上的「第一次数学危机」——当毕达哥拉斯学派发现无理数的存在，整个建立在「万物皆可用整数之比表达」信念上的体系开始动摇。今天的社会科学正面临类似的时刻：我们长期以来衡量学术价值的方式，发表了多少论文、花了多少时间清洗数据、手动编码了多少份访谈，正在被 AI 从根基上挑战。

前 OpenAI 研究副总裁、Tesla AI 负责人 Andrej Karpathy 在 2025 年初造了一个词叫 Vibe Coding（氛围编程），也就是不用逐行看代码，不用管每个细节，凭感觉（vibe）写程序，让 AI 处理具体实现。一年多时间过去了，Vibe Coding 已经从程序员圈子的争议话题变成了一种被广泛接受的工作方式。Karpathy 本人在年度回顾中感慨，当初只是随手发的一条推文，居然造出了一个写进了维基百科的概念。

他现在更倾向于用「agentic engineering」来描述这种工作方式的专业版本，即人类不再直接写代码，而是指挥 AI agent 去写，自己充当监督者。同样的事情正在科研领域发生，有人开始管这叫 Vibe Research：你不用亲手清洗每一行数据，不用手敲代码分析数据，不用逐字打磨每一段文献综述，AI agent 替你处理这些繁重的技术性工作，而你专注于真正重要的事——提出好的问题，做出好的判断，把握研究的方向和节奏。

这听起来像是懒人的借口。但如果你真的试过，你会发现事情远比「懒」复杂得多。它涉及的是一个根本性的问题：在 AI 时代，什么才是研究者的核心价值？ 是亲手敲下每一行代码、手动清洗每一条数据的「苦功夫」，还是提出正确的问题、做出关键判断的「巧功夫」？这个问题的答案，可能会重新定义整个社会科学的价值标准。

我的 AI 科研三部曲

作为社会科学领域的研究者，我和 AI 的关系经历了三个阶段，几乎可以当作这个领域变化速度的缩影。

第一阶段：复制粘贴时代（2025 年以前）。 ChatGPT 刚出来的时候，我和大多数人一样，把它当成一个高级润色和翻译工具。写完一段英文，复制到 ChatGPT 里，让它帮我改改语法、调调措辞，再粘贴回 Markdown 编辑器。来回折腾，效率提升有限，但至少不用再为介词纠结半小时了。那时候的 AI 辅助科研，本质上还是「人干活，AI 打下手」。而且坦白说，这个阶段的 AI 确实经常「帮倒忙」，它会把你精心选择的术语替换成更常见但不够准确的表达，会在不该加逗号的地方加逗号，会把你刻意的口语化表达「修正」成死板的学术腔，你需要花不少时间去纠正 AI 的纠正。

第二阶段：编辑器内协作（2025 上半年）。 我开始用 Cursor 写论文。变化是质的：AI 不再是一个需要复制粘贴的外部窗口，而是直接在我的编辑器里修改文件。Cursor 的 Tab 自动补全让我养成了一种新习惯，写下半句话，按 Tab 看 AI 怎么接，不满意就继续自己写，满意就接受。我写一段，AI 接着写；我标注一个 TODO，AI 帮我填充。主体思路由我掌控，但有了更多的本地上下文，AI 从「场外顾问」变成了「同桌同事」。这个阶段最让我惊喜的不是写作速度的提升，而是一种新的思考方式的出现：我开始习惯用注释和指令来「思考出声」，把模糊的想法转化为具体的任务描述。

第三阶段：Vibe Research（2025 下半年至今）。 Claude Code 和 Codex 出现后，事情又变了。AI 不只是帮你写段落，它开始能理解整个项目的结构，同时修改多个文件，在构思和逻辑层面提出建议。比如说，我可以告诉 AI：「我想检验 X 假设，用 Y 数据集，控制 Z 变量」，它会自动生成分析代码、运行回归、整理结果表格，甚至指出模型设定中可能存在的问题。我现在的工作方式更像是一个建筑师：我画草图、定方向、做判断，AI 去处理施工和细节填充。从「AI 是工具」到「AI 是协作者」，这个转变来得比我预想的快得多¹。

回头看这三个阶段，每一次跃迁的间隔都在缩短。从第一阶段到第二阶段，大约隔了两年；从第二阶段到第三阶段，不到半年。而更重要的是，每一次跃迁改变的不只是效率，而是我思考研究问题的方式本身。第一阶段，我的思维单位是「段落」，写一段，润色一段。第二阶段，思维单位变成了「章节」：我规划一个章节的逻辑，AI 帮我填充。到了第三阶段，思维单位变成了「项目」：我设计整个研究的框架和方向，AI 负责执行和迭代。

AI 科研三部曲：从复制粘贴到编辑器协作再到 Vibe Research 的三阶段演变时间线

2026 年，AI 做科研的能力到底如何？

先说结论：远超大多数人的想象，但也远没到可以无脑使用的地步。

Kustov 在他那篇引发论战的文章中写道：

争论 Claude 是否「真正」具有智能，就像在争论计算器是否「真正」会做数学，而你的竞争对手已经把题做完了。
Debating whether Claude is "really" intelligent is like debating whether a calculator "really" does math while your competitor finishes the problem set.

这句话刺痛了很多人，但它确实点出了一个尴尬的现实：当一部分学者还在从哲学层面讨论 AI 能不能「理解」研究时，另一部分学者已经在用 AI 产出成果了。

斯坦福大学政治学教授 Andy Hall 做了一个大胆的实验：他让 Claude 复现自己 2020 年发表在 PNAS 上的邮寄投票研究。AI 在不到一小时内完成了原本需要数天的工作，花费约 10 美元，且与人工收集的数据相关系数超过 0.999。他据此提出了「100 倍研究机构」的愿景：小型团队指挥大量 AI agent，取代传统的大规模研究团队。金融学研究者 Vincent Grégoire 则在博客中记录了自己如何在四天内用 AI 写完一篇学术论文，原本预估需要四周²。他事后的反思很诚实：如果是我自己不用 AI 写出这篇论文，我会非常自豪。但现在，我不知道该怎么看待它。他也坦承自己并不完全理解论文中每一行数学推导，AI 生成的文献综述中还混进了一条伪造的引用。

与此同时，苏黎世大学的 Project APE 用 AI 自动生成了 204 篇经济学论文，拿去和 American Economic Review 上的论文做对比，随着模型迭代，AI 论文对阵真实论文的胜率从 4.7% 提升到了 7.6%。经济学家 Scott Cunningham 在一篇分析中把这种变化概括成一句话：科学的约束正在从生产端转向评估端。数学家陶哲轩在最近的演讲中表示，AI 不是来抢数学家蛋糕的，而是来把蛋糕做大的。计算机科学家、图灵奖得主、88 岁高龄的高德纳（Donald Knuth）老爷子也对 AI 的能力表达了赞叹。Brookings Institution 的 Messing 和 Tucker 在一篇报告里甚至直说：列车已经出发，等在站台上争论要不要上车已经没有意义了。

AI 时代，传统的多人合作模式反而可能变得效率更低。多人合作需要协调沟通，而 AI 可以在个人层面完成大量技术性任务，省去了摩擦和时间成本。OpenAI CEO Sam Altman 曾预言一人独角兽公司即将诞生，在商业领域这还有待验证，但在学术领域，「一人研究团队」的模型已经触手可及。而且，相比自然科学需要大量物理世界的实验和观测，定量社会科学研究的核心工作包括文献综述、数据分析、文本处理、论文写作，几乎全部可以在数字环境中完成，这为 AI 深度嵌入社科研究的各个环节提供了天然的便利。乔治城大学研究员 Ryan Fedasiuk 在一篇文章中这样描述他与 AI agent 的关系：

我有一个自己的（agent）——一个和我想法完全一样、永远不睡觉的。我不用付他工资，只需要付他的电费。
Now I have my own—one that thinks exactly like me, and never sleeps. Instead of a salary, I pay his electric bill.

但这里得加一句保留：Vibe Research 不等于不思考。 Andy Hall 能让 AI 一小时复现他的论文，前提是他自己花了数年时间理解这个研究问题、设计研究方案、积累领域知识。AI 放大的是研究者已有的判断力和品味，而不是凭空创造这些东西。一个不懂统计学的人让 AI 跑回归，和一个资深计量经济学家让 AI 跑回归，产出的质量天差地别，不是因为 AI 不同，而是因为驾驶员不同。Vincent 在他四天写论文的复盘中总结得很好：AI 让我更快了，但没有让我更聪明。它降低了探索想法的成本，但研究的品味和方向仍然必须来自我。Kustov 在续篇中也区分了两种 AI 使用方式：一种是把 ChatGPT 当文字生成器来复制粘贴，另一种是用 agentic AI 构建完整的研究工作流。前者确实可能产出垃圾，后者则要求使用者本身具备相当的研究素养。遗憾的是，很多批评者把这两种方式混为一谈。

学术界的恐惧与抵制

如果 AI 真的这么强，为什么学术界的反对声浪如此猛烈？Kustov 的文章发出后，在社交平台 Bluesky 上引发了上千条愤怒的回应³。这并不意外，他在文章中直言：学术界是这个星球上最因循守旧的机构⁴。

谁在反对，为什么反对

Igor Logvinenko 在一条广为传播的推文中分析了这个现象，标题就叫「Why Academia Can’t Think Clearly About AI」。Harry Law 则在一篇措辞更加尖锐的文章中写道：他们以为拒绝接触是一种批判，但实际上这是一种放弃。Law 还提供了一个有趣的数据点：目前顶级大语言模型在摘要生成任务上的事实准确率已经超过 99%，在 SimpleQA 基准测试上达到 90–95%。那些还在说 AI 是「胡说八道生成器」的学者，很可能还停留在 2023 年的认知水平上。

软件工程领域有一个有趣的发现：经验最丰富的开发者对 AI 工具的抵触反而最强烈。在学术界，这个规律同样成立，最资深的学者往往最抗拒 AI，因为他们在旧范式中的投入最大，沉没成本最高。宾夕法尼亚大学沃顿商学院教授 Ethan Mollick 用参差前沿（jagged frontier）这个概念来解释为什么人们对 AI 的看法如此两极分化：AI 的能力不是均匀分布的，它在某些任务上超乎想象地强大，在另一些任务上又出人意料地薄弱。一个做计量经济学的教授可能觉得 AI 是神器，而一个做民族志的教授可能觉得 AI 毫无用处。他们都是对的，但都只看到了冰山的一角。

抵制的三个层次

第一层：没试过。 这是最常见也最容易解决的问题。很多对 AI 嗤之以鼻的学者，他们的全部 AI 经验可能就是在 ChatGPT 网页版里输入几个问题，看到一些平庸甚至错误的回答，然后得出「AI 不过如此」的结论。他们从未体验过 agentic AI，那种可以读取你的项目文件、理解你的研究设计、在本地执行代码、迭代修正错误的 AI 工作流。2023 年的 ChatGPT 和 2026 年的 Claude Code，差距就像翻盖手机和 iPhone。如果你只试过前者就对整个品类下了判断，那这个判断注定是错的。Kustov 在他的续篇中直接发出挑战：「如果你觉得 Claude Code 又邪恶又无能，我敢打赌你连安装都没安装过」。这句话可能刺耳，但它指向一个真实的问题：在学术界，我们要求一切观点都有证据支撑，唯独在评价 AI 时，很多人允许自己在没有第一手经验的情况下下结论。

第二层：既得利益受威胁。 有一条让我印象深刻的推文，一位学者写道：「如果 AI 能做到我花了多年训练才掌握的事情，我会感到无比羞耻和丢脸」。这种情感是真实的，也是可以理解的。但它揭示的与其说是对 AI 质量的担忧，不如说是对自身价值的焦虑。一个更极端的例子是一位匈牙利人对 Chinese Text Project（中国哲学书电子化计划）使用 AI 翻译文言文的激烈反对，直言 AI 翻译是垃圾⁵。他自述爱好是刻印章、写书法、读古书，对文言文有真挚的情感，但他的反应近乎歇斯底里，完全否定 AI 翻译的价值。我理解他对文言文的热爱，但他似乎没有意识到：没有 AI 翻译，这些古文对世界上 99.9% 的人来说就是不可读的。AI 翻译可能不完美，但它让知识变得可及，这难道不正是学术的目的吗？

第三层：「努力等于价值」的深层执念。 这是我认为最值得讨论的一层。Every 的一篇文章精准地捕捉到了这个问题：

为什么这些组织如此在意？我怀疑他们并非真正担心 AI，他们执着的是一种古老的信念：如果工作看起来不够费力，那它一定不够有价值。

Why do these businesses care so much? I suspect they aren’t really worried about AI—they’re clinging to an old belief that if work isn’t visibly difficult to produce, it must be less valuable.

这段话让我想了很久。文章作者 Katie Parrott 追溯了「努力等于价值」这种信念的历史：从殖民时期闲散几乎违法的马萨诸塞，到 1911 年那个在工厂里用秒表计量劳动的 Frederick Taylor 科学管理时代，到 2010 年代的拼搏文化（hustle culture）和努力奋斗（rise and grind），再到今天重视到场而非产出的重返办公室政策，零 AI（zero-AI）政策不过是这种古老执念的最新变种。她还写了一句让我很难反驳的话：当计算器普及的时候，没有人说「真正的数学家」应该继续手算长除法。

学术界抵制 AI 的三个层次：从「没试过」到「既得利益」再到「努力=价值」的深层执念

在学术界，「可见的努力」作为价值衡量标准从未消失，只是换了形式：你在实验室待了多少个通宵，你手动清洗了多少行数据，你逐字阅读了多少篇文献，甚至你每天写了多少个字。这些「苦功夫」成了学术资历的隐性指标。AI 的出现直接挑战了这个逻辑。当数据清洗可以在几分钟内完成，当文献综述可以自动生成，当统计分析可以一键执行，那些以「苦功夫」定义自身价值的学者，突然发现自己的护城河消失了。很多「零 AI」政策的本质根本不是质量管控，而是对可见努力的执念。它们禁止的不是低质量的产出，而是「看起来太轻松」的产出。正如那篇文章的结尾所问：你担心的是质量，还是只是对这份轻松感到不舒服（Are you concerned about the quality, or just uncomfortable with the ease）？

这种心态在学术界尤其根深蒂固，因为学术训练本身就是一场耐力赛。本硕六七年、博士四五年、博后若干年、终身教职遥遥无期。经历了这一切的人很难接受一个事实：一个掌握了正确工具的新手，可能在某些任务上比他们更快更好。Kustov 尖锐地指出：「很多对 AI 的反对，本质上是用原则包装的地位保护」。这话说得不客气，但如果你仔细观察最激烈的反对声音来自谁，往往不是刚入行的年轻学者，而是已经在旧体系中建立了地位的资深教授。

这里还有一个值得思考的维度。Kustov 在续篇中提到了一个风险：技能萎缩（skill atrophy）。如果年轻研究者从一开始就依赖 AI 处理数据清洗和统计分析，他们是否会失去独立完成这些任务的能力？这是一个合理的担忧，也是反对者最有力的论点之一。但它的逻辑延伸其实很可疑，按照同样的逻辑，我们是否应该反对计算器，因为它让学生失去了心算能力？是否应该反对搜索引擎，因为它让人们不再背诵百科全书？每一次技术进步都伴随着某些技能的「萎缩」和新技能的「生长」。关键不在于是否会有损失，而在于净收益是否为正。

转变者的故事

但也有人在改变。Chris Blattman 是哥伦比亚大学经济学和公共事务教授，一个多月前他还是一个 Claude Code 的怀疑论者。他称自己不是程序员，看不到 AI 编程工具和自己有什么关系，然后他试着用 Claude Code 创建一些帮助他管理日常工作的工具，处理邮件、追踪项目进度，发出「holy crap」的感叹（大约等同于中文的「我操」或「卧槽」）。从没写过代码的 Blattman 甚至做了一个网站 claudeblattman.com，分享他使用 Claude Code 做的一套个人项目管理工具。用自己的名字和 AI 的名字组合。这种承诺感，比任何学术论文都有说服力。

Ryan Fedasiuk 同样描述了从怀疑到震撼的转变。他现在的工作流程是：让 AI agent 像一个「数字分身」一样替他执行任务。区别在于这个分身永远不需要睡觉。这些转变者的共同点是什么？知识诚实——他们愿意先试再评判，而不是先评判再拒绝尝试。在学术界，这本应是最基本的素养。

未被充分讨论的定性研究

当前关于 AI 与社会科学的讨论，几乎全部集中在定量研究上：AI 跑模型有多快，AI 清洗数据有多准，AI 写文献综述有多高效。定性研究则被普遍认为是「安全地带」，毕竟，AI 总不能替你去做田野调查吧？

这个判断对了一半。Kustov 在他的续篇中做了一个有趣的预测：随着 AI 在定量研究中的主导地位加强，定性研究的相对价值反而会上升。田野调查、深度访谈、民族志、参与式观察，这些需要人类在场的研究方法，恰恰是 AI 最难替代的。正如一位学者在推文中所写：「AI 永远无法取代基于田野调查的研究，我总是这样告诉我的学生」。

我部分同意这个观点。但「AI 不能替代田野调查」不等于「AI 在定性研究中毫无用处」。事实上，定性研究可能是 AI 应用潜力最被低估的领域。原因之一是定性方法本身长期存在的透明度问题。学术界有一个「公开的秘密」：定性研究的分析过程相对不透明，有的学者甚至故意藏着掖着，把方法论当作某种不传之秘⁶。AI 的介入恰恰可以改善这个问题，当你用 AI 辅助编码和分析时，整个过程是可记录、可复现、可审计的，这实际上提升了定性研究的科学性。

伦敦政治经济学院（LSE）的研究者开发了一套开源的 AI 访谈平台，可以让大语言模型担任访谈者，在几小时内完成数千次访谈。他们请哈佛和 LSE 的社会学博士生评估了访谈质量，结论是 AI 访谈「大约相当于一般水平的人类专家」。更有趣的是，受访者反而更喜欢和 AI 对话，因为觉得 AI 不会评判他们，尤其在涉及政治观点等敏感话题时。我对这类工具的当前质量仍持保留态度，「一般水平的人类专家」离「优秀的田野研究者」还有很长的路。但它说明了一个方向：AI 在定性研究中的角色可以是「让田野研究者做得更多」，而不是取而代之。

说到这里，我可以分享一点自己的经验。在过去几个月里，我在自己的研究中用 AI 辅助访谈数据的编码和分析。我把访谈录音转写后的文本交给 AI，让它根据我预设的编码框架（codebook）进行初步编码，然后我逐一审核、修正、补充。初步编码的准确率大约在 70–80%，也就是说，大约每五个编码中有一个需要我修正。这看起来不完美，但考虑到编码工作原本需要的时间，已经把效率提升了好几倍。

不过 AI 在定性研究中给我最大惊喜的一次，反而跟编码无关。有一次，我的访谈录音里受访者说了一个词，我反复听了无数遍都没听懂，可能是方言或行业术语。最后我把那段录音切出来上传给 Gemini，它的转写结果虽然也不完全正确，但恰好给了我一个启发，帮我猜出了那个关键词的意思。这不是什么惊天动地的突破，但它让我意识到 AI 的价值有时候不在于给出正确答案，而在于提供一个不同的视角来启发你自己的思考。

当然，AI 编码也有明显的局限。它对讽刺、反语、文化隐喻的理解经常出错；它对语境的把握远不如人类研究者；它无法感知访谈中的情绪张力和非语言线索。所以 AI 在定性研究中的角色，至少目前，只能是辅助者。与其说「AI 永远无法替代田野研究」，不如换一个框架来思考：在定性研究中，人类和 AI 可以互为 copilot。人类之所以不可或缺，根本原因在于，在可预见的未来，AI 无法在物理世界中进行实验和观测，比如走进一个村庄、与人面对面交谈、感受一个社区的氛围，这些事情只有人类能做。而 AI 擅长的是转写、初步编码、模式识别和大规模文本分析。二者各司其职，各取所长。

定性研究中的人机互补：人类擅长田野调查与情感感知，AI 擅长转写编码与大规模分析

学术发表的裂变

AI 改变的不只是研究的生产过程，它正在动摇学术发表的整个基础设施。

经济学家 Scott Cunningham 在一篇详尽的分析中算了一笔账：如果论文生产成本降低到原来的百分之一，投稿量翻五倍，而顶刊的版面固定不变，会发生什么？答案是：顶级经济学期刊的录用率会从 5% 暴跌到 1%，审稿系统会不堪重负（目前需要约 54,000 份审稿报告，五倍投稿量意味着需要 146,000 份），期刊会因为投稿费增加而坐收渔利。他用一句话总结了这个变化：「科学的约束正在从生产端转向评估端」。换言之，瓶颈不再是写论文，而是读论文。

Dave Karpf 则从另一个角度审视了这个问题，他的立场比 Kustov 审慎得多，也尖刻得多。他认为学术论文本来就不是社会科学本身，只是一种记分方式：「论文不是社会科学，它们只是计量单位，是我们的记分牌」。如果 AI 能批量生产论文，本来就已经不堪重负的同行评审根本撑不住。但 Karpf 的态度是：good riddance（走了正好，早该淘汰）——本来就该这样，那个「发表最多论文者胜出」的游戏，从一开始就是对真正知识生产的扭曲。他认为研究者现在最该做的事情是回归本质：你真正想回答的问题是什么？去回答它。

一位曾在国际关系期刊 Security Studies 担任副主编的学者在一篇题为「The Age of Academic Slop Is Upon Us」的文章中描述了他的亲身经历：AI 时代，投稿量翻了两三倍，大量稿件和期刊主题毫无关系，桌面拒稿率飙升到 75%。但他更担心的不是这些显而易见的「泥石流」，而是那些方法上无可挑剔、通过同行评审毫无问题、但缺乏原创性的 AI 论文。他给这类论文取了一个德语名字：Automatenwissenschaft：自动化的常规科学。它们技术上合格，但没有人会真正阅读或引用。这位学者的结论是：当技术执行不再是瓶颈，品味和判断力才是区分好研究者和平庸研究者的关键。

可是，那 30 页 PDF 的传统格式，真的还有存在的必要吗？Kustov 指出，考虑到大多数论文发表后几乎无人问津，AI 事实上已经成为学术论文的主要读者。也许未来的学术成果应该是可复现的代码仓库、实时更新的数据仪表盘、机器可读的结构化数据。Andy Hall 已经在实践这个想法：他提议「每篇新的实证论文都应该附带一个证明 AI agent 能成功复现其结果的验证」⁷。如果这成为标准，不可复现的研究在结构上就无法发表，这不正是学术界梦寐以求的复制危机的解药吗？

2026 年春节期间，中文互联网密集涌现了一批学生自办刊物，例如「Rubbish」（垃圾）、「Notrue」（模仿 Nature），以及 SHIT Journal 这样的「学术底刊」，甚至有人搭建了一个叫 Web of Nothing 的「首屈一指的无用水刊索引平台」。这些刊物当然不是严肃的学术替代品，但它们是症状，折射出一整代年轻研究者对「发表或灭亡」（publish or perish）体制的厌倦和反叛。AI 只是加速了这种裂变：当一篇论文可以在四天内生成，而发表它需要两年，这个体系的荒谬性就变得无法忽视了。

值得警惕的是，Cunningham 的分析还揭示了一个二阶效应：当所有投稿都经过 AI 润色、质量差异被压缩后，编辑将越来越依赖启发式判断，即作者的机构声誉、导师的名气、研究方向是否时髦等标准。换言之，AI 可能会加剧而非缓解学术界已有的不平等。这是一个值得每个 AI 乐观主义者认真面对的问题。

结语

回顾我自己从复制粘贴到 Vibe Research 的转变，最大的感受其实跟效率无关。变化最大的是思维方式。

Nature Reviews Bioengineering 发表过一篇题为「Writing is thinking」的编辑评论，核心论点是：写作迫使我们思考，不是那种混乱的、非线性的心智游荡，而是结构化的、有意图的思考。作者还提出了一个发人深省的问题：如果写作就是思考，那么当我们读 AI 写的论文时，我们读到的究竟是谁的思想？

这篇文章说得有道理。但我想补充一个角度：Writing prompt is also thinking。

写好一个 prompt，也就是发给 AI 的指令，同样需要良好的思维能力。你得清晰地定义问题，因为模糊的指令只会得到模糊的结果。你得明确你的假设，因为 AI 不会替你决定什么是重要的研究问题。当 AI 给出五种分析方案时，选择哪一种取决于你的学术判断。而评估 AI 产出的质量，可能比自己写还难，你需要识别那些看起来流畅但实际上有问题的分析。这个过程和传统写作一样，需要调动全部的领域知识和批判性思维。只不过你的思维产出不再是一段段文字，而是一个个精确的指令和判断。剥离了繁琐的执行层面之后，剩下的是更纯粹的思想工作。

人们都说 AI 时代「品味」（taste）很重要，我非常赞同。但品味不是凭空产生的，它来自长期的阅读、思考、写作和实践。AI 可以放大品味的价值，但不能替你培养品味。Vibe Research 不是「不思考的研究」，它只是把思考的重心从执行转移到了判断。真正的深度从来不在于你手动分析了多少行数据，而在于你能不能问出好问题、解释好这个世界。

两百多年前，美国第二任总统、开国元勋 John Adams 写过这样一段话：

我必须研究政治和战争，这样我的儿子们才能拥有研究数学和哲学的自由。我的儿子们应该研究数学和哲学、地理、博物学、造船学、航海术、商业和农业，目的是为了让他们的孩子有权利研究绘画、诗歌、音乐、建筑、雕塑、织锦和瓷器。

I must study Politicks and War that my sons may have liberty to study Mathematicks and Philosophy. My sons ought to study Mathematicks and Philosophy, Geography, natural History, Naval Architecture, navigation, Commerce and Agriculture, in order to give their Children a right to study Painting, Poetry, Musick, Architecture, Statuary, Tapestry and Porcelaine.

每一代人做繁重的基础工作，是为了让下一代人能够追求更高层次的创造。AI 做数据清洗、文献综述和统计分析，某种意义上就是在做这一代的「苦活」，好让研究者把时间花在真正需要人类智慧的地方，提出好的问题，做出有勇气的判断。

Kustov 说得对：「AI 正在颠覆的那个系统，本来也没有运转得很好」。Dave Karpf 说得更直接：「我们确实处于危机之中，但不是因为 Claude。整个知识生产体系已经被削减经费、遭受攻击、陷入螺旋式衰落。那不是一个 AI 的故事」。学术界的复制危机、引用注水、p-hacking 泛滥，这些问题在 AI 出现之前就已经存在了。AI 没有制造危机，它只是让一场早已酝酿的危机变得无法忽视。

我不知道几年后的学术界会是什么样子。Kustov 也坦承他不知道，这种诚实的不确定性，比任何一方的笃定都更有价值。但有一件事我比较确定：AI 不会因为某些人的抵制而停止进步。学术界面临的问题已经不是「要不要接受 AI」，而是「怎么整合 AI 才有意义」。那些愿意先试再说的人，会比躲在「零 AI」政策后面的人走得更远。

也许我对 AI 的乐观过头了，也许一年后我会回头修正自己的很多判断。但至少，我是在亲身实践之后说这些话的。希望这些观察和经验，能给你提供一点思考的素材和行动的勇气。

本文主要使用 Claude Code Opus 4.6 创作，由 Codex GPT-5.4 和作者本人修改润色，相关文件及代码见：https://github.com/TomBener/vibe-research-sspai

> 参与 2025 年度少数派征文，分享你的观点和经验 ✍🏻️

> 简单、好用的视频下载工具，少数派为你呈现 🚀