按:AI 对媒体的影响一直众说纷纭。少数派编辑部(套用一个经典句式)可以说是「站在科技和媒体的十字路口」,AI 对我们的日常工作不是一个「用不用」的问题,而是「怎么用」的问题。本期《装了啥》中,我们就请编辑部的几位成员介绍一下 AI 工具在日常工作中的实际应用,或许也能对你有所启发。
批量处理文字格式
@张奕源Nick:在 ChatGPT 走红之后我就注意到了这款工具。在我看来,以 GPT 为代表的大语言模型最大的意义就是降低了人类与机器沟通的门槛,电脑终于可以相对准确地理解模糊的自然语言,并将其归纳成有条理的指令或结果。因此,当 ChatGPT 面向公众开放之后,我就开始尝试将其纳入工作流。
我使用 ChatGPT 最高频场景之一就是处理文字格式。有一个冷门但非常实用的用法,还是我跟甜食老师学来的——
在使用《Reaper》等工具剪辑播客时,我会在剪辑的时候同步标记时间戳,剪完之后就能直接导出,方便生成播客章节。但是,《Reaper》导出的时间戳格式是这样的:
理论上来说,使用文本编辑器配合正则表达式进行替换就能将之变成简洁、规范的格式,但对我这种代码苦手来说还是有点麻烦。而且写好的规则还得另行保存,以便每次用到的时候调取,需求本来不大,步骤却增加了不少。
用 ChatGPT 就简单多了。只要先告诉 GPT 我想做什么:
Can you help me adjust the format of the text? Please remove the "M1,", "M2,", etc. at the beginning of each sentence, and remove the decimal part of the timestamp at the end of each sentence. Then, move the timestamp to the front of each sentence and format it as 00:00:00.
接下来,它就会自动处理:
使用 ChatGPT 更方便的一点是可以让它记住以上操作,并且每次都做相同处理。一次写 prompts,终生自动化,省时省力。
类似的操作在我的工作流中还有很多,尤其随着 GPT 模型的升级,除了其对话和理解力越来越强之外,每次对话支援的文本长度也越来越多,我目前已经可以把一整篇文章丢进去让它一次性清理格式、插入中西文空格、统一替换标点符号等,大幅降低了重复性工作的时间成本。
边写边聊,核查事实、获取灵感
@克莱德:和编辑部的其他同事不同,我开始使用 AI 工具辅助工作的时间其实算晚的。生成式 AI 爆火的那段时间,少数派后台也有过不少直接由 ChatGPT 生成的投稿,那种「先说结论+有序列表拆解原因+『总的来说』式收尾」的结构是那么显眼,又是那么无趣——如果没有高超的提示语引导,AI 和「创作」二字在我看来完全没有半点关联——而我又没那么多兴趣和精力去钻研提示语工程。
用王树义老师在《如何高效使用 ChatGPT?》一文中的话来说就是认识没摆正,再加上那段时间试用 ChatGPT 和 Bard(后来改名 Gemini)的体验确实也不算太好,「AI 解放生产力」这件事就因此搁置了。
直到去年 9 月,早前集成在 Bard 当中的 Google 搜索功能从「话题探索」摇身一变成为了「事实核查」的辅助角色,我才正式开始了将 AI 工具融入到文章写作的流程当中。
我并不需要 AI 来帮我写作,但在稿件撰写过程中,我偶尔会先将写作话题抛出来让 AI「跑一跑」,看看大模型们会如何针对这个选题展开论述、它们用什么结构梳理这个问题,如果站在读者的视角,哪些地方又是可以简化处理的。
当然了,虽然在少数派的内容创作一般而言还谈不上什么 writer’s block,因为某个特定细节不确定该如何展开、或某些关键概念自己都不算特别明白的时候,文章的写作往往也会因为这些障碍陷入停滞。最后回过头会发现遍地都是「想写但没能填完的坑」。所以写作过程中我也经常带着一些更为明确的问题去寻求 AI 的帮助,比如如何用尽可能通俗的方式解释某个专业名词、用比喻的方式说明两个概念之间的关系等。在一些带有科普性质的选题写作中,类似的问答自然也有被大模型那种「自以为是」的幻觉带偏的风险,因此在找到我认为可以采用的内容后,借助 Gemini 的 Google 搜索核查功能评估内容和数据的可靠程度也是必不可少的一环。
Gemini 针对中文搜索核查的效果其实非常有限,但聊胜于无。并且因为平时这种「你会怎么做」的用法和场景比较多,不久前我又开始从 Gemini 转向了和我使用场景更贴近、功能设计思路也更符合我对 AI 工具期望的 Perplexity,它的「发现」功能在我看来就是一个更有趣的「维基百科」,时不时打开扫一眼就能捕捉一些近期热门的资讯和话题,在关键资讯的图文和内容排版上 Perplexity 也做得清晰、直观,既是搜索引擎也是热点「懒人包」。
说到底在写作这件事情上,我觉得我需要的是一个能够时不时闲聊几句、期待在此过程中找到选题展开思路的「写作搭子」,在做好事实核查、保证信息可靠性的前提下,它能让你跳出自己积累多年的写作习惯和写作风格,提供一些截然不同的创作视角以供参考。
就像王树义老师说的,摆正认识,在写作过程中拥有这样一位辅助也不会反过来给使用者带来太大的心理压力——你看我还是没有花时间去学习怎么写提示语。
寻找技术概念的浅易解释
@广陵止息:作为编辑部里的好奇星人,自从 ChatGPT 上线之初我就好奇 GPT 背后的技术原理,在通读了相当多的资料以后,我发现 GPT 本身就是个串词游戏——从上文中找到词和与之关联的词,然后根据训练的素材,找到其他和之前词有关的其他词,最终根据一些优先级将词组拼接成句。这种存在一定「想象力」的输出方式,让我迫不及待地用在了一些简单改稿工作中。
在 GPT-4 模型发布以后,更大的模型也带来了更丰富的想象力,这也驱使着我想要把生成式人工智能逐步融入我的工作流中。但直接用 AI 写东西肯定是不行的,哪怕是用尽 Prompt 提示词优化的手段也不行,毕竟模型永远不懂我们真正想要写的东西,车轱辘话也是真的多。所以目前 GPT 在大多是以助手的形式,参与到我的写稿工作流中。
以我最常写的科普文章为例,没有任何技术背景的读者在阅读科普时最常遇到的情况就是读不懂,所以科普文章最重要的就是通俗易懂。GPT 可以在 2 个方面辅助我,一个是在我准备阶段,帮我找出选题内容中可能需要解释的专业术语,方便我在写作时提前避开不重要的术语,或者在更早的地方引入提前做出解释。
比如我之前的一篇 Wi-Fi 7 技术的科普,我对 Wi-Fi 技术的各个细节都有一定的研究,但我又吃不准文章里的技术细节应该写得多深入。在咨询 ChatGPT 以后我得到了下面这样的回应,在帮我锚定受众的同时,圈出几个需要解释的术语方便我提前做出规划。
另一个就是写作阶段,我需要 GPT 帮我找出和专业概念相似的、现实中比较常见的情况做例子,让我能更生动形象地向读者介绍技术细节。不难发现,这两个方向其实都是从词与词之间的关系,找出下一个合适关键词,都依赖于生成式模型的想象力。在后续写作的过程里,我也可以把技术细节和希望举例的对象一起告诉 ChatGPT,让 GPT 模型帮忙找出更易懂、更贴切的例子,方便普通读者理解。整个写作流程比起以前写到一半,再去前面前面删删改改,或是想要找一个贴切的例子想到头秃的情况比以前少多了。
当然了,我整个工作流里 AI 仍然是以一个配角的形式出现的。正如那句知名的说法「生成式模型是互联网副本的有损压缩」,我知道生成式模型「看过」的资料一定比我看过的多得多,但有损压缩也意味着会丢掉很多关键细节,加上生成式模型一直以来存在的幻觉,只依靠生成式模型完成整个项目不亚于在脆弱的地基上建起高楼大厦。
与其指望生成式模型能在一个项目上做好,倒不如借助生成式模型本身的特性——「见得多」「能联想」帮我处理推进项目时,很难在第一时间兼顾到的地方,让我把精力放在更有意义的地方。
整理科技资讯素材
@PlatyHsu:准备每天早上汇总科技新闻的「派早报」栏目是个说难不难、说简单也不简单的任务。理想情况下,一条资讯应当包含取自靠谱来源的基本事实,并补充必要的背景信息,控制在三个自然段左右篇幅。对于产品发布、功能更新之类的简讯,查阅一两个官方或权威来源就够了。但如果遇到一些重大、复杂且还在持续发展的行业事件时,就可能需要汇总并整理很多来源的报道,才能写出一条准确、清晰的资讯。在这个过程中,AI 能起到不少省事的作用。
例如,前不久的一个周末,IT 圈都被 CrowdStrike 软件造成的重大事故「刷屏」了;这家安全软件提供商推送了一个有缺陷的更新,导致设备蓝屏死机,重启也不能恢复。显然,这个新闻需要在周一的早报中有所反映。但因为事件发生不久,后续进展还在快速更新中,需要先广泛收集各个媒体的报道,然后从中提炼出关键信息。同时,考虑到少数派读者并不都具有系统维护和信息安全方面的专业背景,还需要对这次事故的成因和原理做一定科普,才能让读者理解这次事件。当然,这些信息必须足够精炼,能够容纳在早报的有限篇幅中。
为此,我首先从自己平时常看的媒体(主流媒体和科技领域垂直网站皆有)找到了十几篇报道,用浏览器插件 MarkDownloader 将其下载为纯文本 markdown 格式,然后使用终端命令
cat *.md >> combined.md
将其合成单个文件。
为了首先让自己快速获得一个直观印象,我将这个文件作为附件上传给 Google Gemini 1.5 Pro 模型,然后加上下面这段提示词:
Attached are 10 news articles about a recent major outage in the tech industry. Read through these articles and create a timeline of the events. For each event, include the time and date and a brief summary. Use markdown table in the output.
也就是让它以表格形式整理一个时间线。输出效果如下:
以这个表格为线索,我快速用搜索关键词的方式读了一遍原文中的相关段落(主要是因为不能保证模型不会出现幻觉)。然后,我用下面的提示词让模型帮我写一版初稿:
Using the information extracted from these articles, draft a brief summary of the events that have occurred so far, following the general structure of journalistic writing. Conclude with a brief introduction to the technical background and terms relevant to the event so that it’s easily understandable for the general public. The summary should be no more than four paragraphs and 600 words. Output in Chinese.
注意这里从内容(事件概述加背景介绍)、风格(一般新闻写作、大众能够理解)和格式(四个自然段、六百字以内、翻译为中文)几个方面提出了要求。结果如下:
应该说这个效果还是不错的,中文翻译效果也说得过去。虽然没有到可以直接用的程度,但至少提供了一个很好的起点和框架。