导语
前两年 Netflix 纪录片「监视资本主义:智能陷阱 The Social Dilemma」大热,引发了对推荐算法、「信息茧房」的大讨论。而后和所有热门讨论一样,很快所有人就忘了,重新回到舒适而充满刺激的信息茧房里。MIT 的研究生开发了这个软件,利用 AI 来帮大家对抗推荐算法……它能成功吗?
RecAlign(Recommendation Alignment) 是一个 Chrome 浏览器插件(在这里下载),它利用 OpenAI 的 GPT 来帮你过滤推特、知乎上系统推荐的信息。它也是开源项目,这是 GitHub 上的 项目页面。
插件还在验证概念的极早期,所以功能、用法都很简单:你用自然语言描述过滤标准,即「自己不想看什么内容」插件利用 GPT 理解你的要求、生成过滤条件,下次你刷新推特或者知乎时,插件会自动隐藏那些不符合你过滤标准的信息。
RecAlign 插件的 开发者 是 MIT 麻省理工学院的研究生,他为插件提供了推特、知乎两个过滤器。我每天频繁使用推特,当然就用推特来做测试。
既然 RecAlign 背后的 AI 就是我们熟悉的 GPT、ChatGPT,我就按 ChatGPT 设置 Prompt 的标准来设置条件。我设置的过滤条件是「只看设计和 AI 相关的 tweets,不要看 AI 生成的图片」。理论上这前半句很符合 ChatGPT 的要求,应该能 RecAlign 能力的最优表现;后半句对 ChatGPT 而言有点似是而非,我猜 RecAlign 可能未必能理解。
先测试「只看设计和 AI 相关的 tweets」,过滤效果非常好(尤其是相对于这么早期、概念性、实验性的工具而言),果然和设计、AI 无关的大部分推文都被隐藏了。
测试下来最明显的缺点是过滤和隐藏推文的速度较慢,考虑到推特的 feed 是实时的、没什么方法提前过滤,而插件逐条读取推文、判断是否满足过滤条件,这个过程也不容易加速……这种用户体验的问题就留给产品化阶段的设计师和程序员吧。
测试「不要看 AI 生成的图片」的过程比较好笑,我拿曾经最可爱、现在变成「触目惊心」的 Stable Diffusion 插件 Waifu Diffusion 来作为测试基准,看看 RecAlign 能否把这些明显包含了 AI 生成的图片的推文过滤掉。
实际测试下来,多数情况 AI 图片推文都幸存了,只有某一次 RecAlign 展示了对话框提醒我:这真是你研究所需的吗?(原文是英文,这是大意,一闪而过我没记下来)。结果和我之前猜测的差不多,我想主要还是因为我设定的过滤条件/prompt 太含糊了。
如果平时不上推特,那么大家也可以拿知乎来测试这个 RecAlign 信息过滤插件。
解决了什么问题
RecAlign 表面上的定义是对抗推荐算法,帮大家打破「信息茧房」。不过这只是一个使用案例,从产品设计角度来看,RecAlign 展示了用 AI 帮助用户过滤数据的能力。
一方面它利用 GPT、ChatGPT 的自然语言能力理解用户相对模糊的过滤条件
以往的过滤条件大多很刻板、机械,比如按时间排序、按地区推荐我周围的人、按我主要的兴趣推荐信息,每次用户得打很多勾、选择很多选项,不但操作起来很麻烦,而且天知道那些黑心产品经理和程序员列举的那些「过滤条件」到底是什么意思。相比之下,用户使用 GPT、ChatGPT 和背后的 LLM 大数据模型来设置模糊的过滤条件,AI 能把含糊的感觉转换为过滤条件,这个过程不需要用户参与。
多数情况下,用户并不清楚自己将要检索、筛选、过滤的系统,通过自然语言一轮一轮询问的方式,可以帮助用户确定检索、筛选、过滤的条件。比如你去图书馆,你哪里知道里面有什么、没有什么、什么更好、什么就是垃圾?如果有亲切热情的图书馆管理员 / 亲切热情的 AI 可以咨询一下,这个问题会简单一两个数量级。
另一方面,基于 AI 的智能过滤,适应各种重视用户体验的场景
只看「对抗推荐算法」的案例,这种支持模糊条件的智能过滤似乎用处不大,实际上它可以用在各种场景。
比如我热爱学习,希望在推特上跟真正的创造者、有识之士学习,那么我可以用智能过滤筛选推特用户。这么操作能从推文的上一级开始过滤,从根子上就把不合适的人都干掉。
比如我想找一找最新的英文 UX 设计类书籍,以前我要么去卖书、读书网站搜索,要么去推特看优秀设计师的推荐……都挺累。以后我可以直说:我想看最近一两年出版的英文 UX 设计书籍,优先推荐被很多推特上优秀设计师推荐的书籍。
又比如我想买新的咖啡,我是问「我想喝比星巴克拿铁苦一点点的咖啡」、还是问「我想喝某某产地、某某品种的某某咖啡豆」?显然前者简单得多。
AI 带来的这些简单、便利,会让提升那些我们熟视无睹场景的用户体验。
毕竟我们每个人都是某种「选择困难症」患者,能帮我们做出选择的……都是好工具。
产品设计想象空间
RecAlign 属于验证概念的作品,并非实际的工具或者产品,就不具体分析怎么改进它的设计了。
下面还是说说未来的产品设计——如果设计类似的、通过 AI 过滤信息的产品,应该注意什么、建议怎么优化设计、还能创造出哪些更好的产品。(注:只说设计策略,不聊具体的设计方法)
AI 更适合过滤还是推荐
过滤是做减法、推荐是做加法,通常过滤比推荐困难得多。
现在的推荐算法之所以那么有效,程序和算法的效率只是次要因素,推荐更多地依赖现代心理学、社会学、认知科学对人性的理解。通俗一点说,我们每个人都贪心、都害怕错失,这些欲望和饥饿、恐惧、繁衍下一代一样,都是经过几百万年进化、被印刻在每个人大脑深处的本能。只靠后天的过滤,其实很难抵抗这种本能。
我想正常的有商业目的的人,都会利用 AI 去继续提高推荐的效率,并用 ChatGPT 自然语言交互的能力,让推荐结果看起来更友好、更有价值。
而 AI 驱动的过滤工具,一方面更适合专业领域、特定领域,比如用于模糊地搜索资料,比如更接近人类思维的方式分析统计数据,比如处理高维度的、来源混杂的、缺乏规律的、不知道该怎么组织的资料……AI 在这样的场景下,可以降低原始资料的处理难度、处理规模。
另一方面,AI 驱动的过滤工具,可以在算法推荐、手工搜索之后,提供一个辅助手段来缩小结果,比如我去电商网站搜索「母亲节礼物」,显然我会得到一堆又一堆推荐商品,如果这时候 AI 能帮我过滤掉俗气的、花哨的、不实用的商品,就能节省我的大量精力。
增加过滤的成就感
既然推荐天然地符合人性,而过滤总是某种自寻烦恼的苦差事,那么用 AI 提高了过滤效率之后,更需要帮助用户感知这些改变,利用正反馈来帮助用户更多地使用过滤。
这方面的策略和方法非常成熟,就不展开说了。
简单而言,比如训练狗狗,你怎么能让几百万年都随地大小便的狗狗,学会「上厕所」用奖励的方式,帮狗狗形成条件反射。
让 ChatGPT 们变得更快、创造更好的使用体验
前文提到 RecAlign 处理速度太慢了,其实这是所有 GPT、ChatGPT 类产品共同的问题。我们都习惯了刷新一下、几十毫秒就得到结果,而你问 ChatGPT 一个简单问题,最快也得等待几秒。
- 技术上:有很多手段让慢速操作变快。比如只用慢速的 GPT 处理最初和最后的人机交互,把实际的数据处理交给更快的本地程序。
- 产品设计:是避免 GPT 太慢的主要一环。比如 GPT 不适合过滤推特这样实时的信息流,但在更新速度相对较慢的知乎,「慢慢吞吞」地过滤信息的负面感觉就小得多,而在独立电商网站提供 GPT 过滤功能,慢速过滤的综合体验甚至能做到相对舒适。
- UX 设计:中也有一些基本的设计策略,让慢速的操作感觉挺快。比如从视觉上弱化速度慢的感觉,如果我们首先把推特界面上花里胡哨的视觉元素简化,那么可以用 UI 的简单来制造速度挺快的假象。又比如预先载入信息、或者延迟载入信息,避免用户被处理信息的过程卡住,现实中最常见的一个例子是图片的延迟载入/lazy loading。
最底线是开发者、产品经理、设计师得时刻意识到 ChatGPT 们天然的「慢」。
现在 ChatGPT、GPT 为代表的 AI 只有几个月大,很多着急上线的产品设计、UX 设计都不咋地,慢吞吞的产品一样可以赢得用户;但是后面随着产品的普及,用户体验的影响会越来越大,AI 的「快」会重新变成重要的竞争因素。
回到最初的问题,我觉得 RecAlign 和类似的插件都难以对抗推荐算法、打破「信息茧房」。
恶人会用 AI 来优化推荐算法、让推荐更击中我们的要害。而我们很难用 AI 来帮我们更平静、更有目的、更有耐心、更关注价值……这些对抗推荐算法的基本能力,来自积极的生活态度、合理的价值观、强大的内心、超越常人的耐心……这些都不是哪个工具能解决的。
重要的时刻,只有我们自己能帮助自己。
– FIN –
> 下载 少数派 2.0 客户端、关注 少数派公众号,解锁全新阅读体验 📰
> 实用、好用的 正版软件,少数派为你呈现 🚀