「生成」的「反刍」

Matrix 首页推荐

Matrix 是少数派的写作社区，我们主张分享真实的产品体验，有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章，展示来自用户的最真实的体验和观点。

文章代表作者个人观点，少数派仅对标题和排版略作修改。

影视飓风发布了一条偏议论散文风格的片子，简单来说就是在视频社交媒体上，越来越多的人对于看到的视频产生越来越多的「是 AI 吗」的质疑，这些质问最终伤害了创作者。不过包括影视飓风的这条视频在内，大家对生成式人工智能的抱怨最终似乎都会被杂糅成两个问题：一个是创作者对于工作流使用生成式人工智能的隐瞒，另一个则更为隐蔽——生成式人工智能的工具，究竟会如何影响我们的审美。

扩展阅读：为什么没人喜欢你用 LLM 写出来的东西？

前一个问题当然是更紧迫的问题，毕竟互联网的信任机制正被迅速打破，对舆论和意识的话语权问题也有影响。但我并不想在这篇文章中展开这个问题，我更想来谈的是后面那个问题：生成式人工智能会对我们的审美造成什么样的影响。

大模型在做的事情

先来讨论一下我们使用生成式人工智能创建图像、音频和视频等多媒体（多模态）内容时候会发生什么吧。

在用户侧，我们所做的事情是将想要的东西以语言（提示词）的形式描述出来，然后模型根据这份文本生成对应的视频。我们按照文本的语言容量通常是几十到几百 KB 估算，生成的视频则是几兆（MB）到几百兆不等。前后相差几百到上千倍。

按照信息熵理论，信息不可能以如此大的压缩率无损缩放，过程必然涉及对原本信息的篡改，包括补充、粉饰和舍弃。

从高熵到低熵丢弃的过程很好理解。我很推荐你收听重轻的《不在场》播客第二季第一集节目，这是我见过的对「有损压缩」解释得最好的节目；而反过来，从低熵补充信息到高熵，就是模型在做的事情。毕竟没人会把每个像素点的 RGB 值直接扔给模型——那也不需要模型，直接扔给显卡就好。

如果要探究从提示词文本到多媒体内容，模型究竟在做什么，飞天闪客一期关于视频生成模型的节目和 HEM Records 的探究（当时的）AI 能做到什么样的音乐的节目，某种程度上就在讨论这个问题。给没有看过这两个视频的朋友们简单解释一下节目的中心思想：与我们认知中「说得更详细就能得到更好结果」不同，说得越模糊、要求越低，模型做到「符合要求」的可能性越高。（如果你还是不能理解这个逻辑，十分推荐分别点进这两个视频，都看一遍。）

大语言模型本身没有任何的创作能动性，即使是「小步快跑也在超速进展」的生成式模型，它所做的也只是「将人类的文明做一个平均数」。连加权平均也没有。

因此大模型在「要求不高」的提示词中间的缝隙中，填充的就是「人类文明的平均数」（用 fancy 一点的话来说，我们会管这个「平均数」叫做「幻觉」）；我们从模型里收获的东西，也只能是「带使用者审美」的「人类文明的平均数」。

但人不是。

人在创作上可以有偏见（bias）、可以有自我审美、可以有艺术滤镜，生成式人工智能之前的世界有着无数个这样的「认知裂隙」，事实上造就了人类文明历史上大量的细分艺术形态和风格。

如果把生成式 AI 拿给拥有正常的审美和强烈的自我表达意识的创作者们，他们几乎不会担心使用 AI 会对自己的艺术造成什么影响：对他们而言，它只是一个创作工具，仅此而已。但对更多的创作者来说，问题就会更严重一些。但这个问题早在模型出现之前就已经显现。

生成式审美反刍

我们前面提到，生成式 AI 模型们创作的时候更喜欢「模棱两可的地方比较多」的指令，这样它们就有办法将自己学到的「平均数」都塞到输出结果里。而在信息传播过程中，这些填充的信息同样会被其他同为受众的创作者吸收。

往坏了说，如果所有人都用平均数来创作，最终会令世界上所有的创作都变成了「平均数生成比赛」。

和 Claude 讨论了一下这个想法之后，我决定将这个过程称作「生成式审美反刍」，Claude 建议我把它的英文描述确定成「Generative Aesthetic Rumination」。它的意思是，在生成式人工智能广泛应用的环境下，人们利用 AI 在提示词里填充泡沫塑料（填充信息熵），然后这样的信息熵会被人们反过来吸收。

最终，泡沫塑料本身成为下一个作品中表达的一部分，经过再创作、再吸收，泡沫塑料也会在最后变成审美的一部分，达成一种「递归」式社会审美趋同的效果。

但正如我之前所说，「生成式审美反刍」并非是凭生成式模型一己之力造成的问题，这个问题早在媒介变化的过程中就已经显现。从传统报纸电视、博客、RSS 到之后的视频网站、短视频，这个过程中信息熵都是在急剧压缩的。特别是由字节跳动以来的互联网，人们亲手开启了「推荐算法」的潘多拉盒子，以及「注意力经济」速来快走的特性，令「调动人们的兴趣」成为了一条有且唯一的成功捷径。

此时「用平均数」就成为了所有创作者的「平均数」。

你能做到的事情

除了《女神异闻录 5》（Persona 5，P5）本篇，我同时也很喜欢同代的支线作品《女神异闻录 5 乱战：魅影攻手》（Persona 5 Strikers，P5S）。我甚至认为，在故事立意上 P5S 是可以和本篇平起平坐的。因为 P5S 的故事设定是「所有人都有一个无所不知的 AI」，而这刚好就是 2022 年末以来，以 LLM 为首的人工智能大跨步跃进后的世界。

P5S 故事的最后，「叛变」的 AI 索菲亚最终在与怪盗团的行动最后，看到了在涉谷烟花，更确定了要成为「人类的好朋友」的目标。但现实是，现在的 AI 模型只能躺在数据中心的服务器里，以人类的平均知识和平均价值观「和稀泥」。

它无法真正感受现实世界，无法培养真正的审美，无法做到有偏见（bias），更谈不上任何的能动性。

但你还可以。如果你觉得你要将这份珍贵的礼物用来给 AI 跑腿，那我尊重你的选择；不过你有另一条路可以选——你可以自己去感受这个世界，用眼睛、用腿、用你一切的感官、工具、甚至是 AI 去感受这个世界。

你有 AI 彻底做不到的事：审美、经验、精神，这些都是躺在数据中心的模型望尘莫及的东西，即便他有无量大数级别的参数，也无法替代这件事。

所以，去感受、去思考、去创作吧。这是只有身为人类的你能做到的事情。

题图来自 Unsplash+

> 关注少数派小红书，感受精彩数字生活 🍃

> 实用、好用的正版软件，少数派为你呈现 🚀