Matrix 首页推荐
Matrix 是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章,展示来自用户的最真实的体验和观点。
文章代表作者个人观点,少数派仅对标题和排版略作修改。
影视飓风发布了一条偏议论散文风格的片子,简单来说就是在视频社交媒体上,越来越多的人对于看到的视频产生越来越多的「是 AI 吗」的质疑,这些质问最终伤害了创作者。不过包括影视飓风的这条视频在内,大家对生成式人工智能的抱怨最终似乎都会被杂糅成两个问题:一个是创作者对于工作流使用生成式人工智能的隐瞒,另一个则更为隐蔽——生成式人工智能的工具,究竟会如何影响我们的审美。
前一个问题当然是更紧迫的问题,毕竟互联网的信任机制正被迅速打破,对舆论和意识的话语权问题也有影响。但我并不想在这篇文章中展开这个问题,我更想来谈的是后面那个问题:生成式人工智能会对我们的审美造成什么样的影响。
大模型在做的事情
先来讨论一下我们使用生成式人工智能创建图像、音频和视频等多媒体(多模态)内容时候会发生什么吧。
在用户侧,我们所做的事情是将想要的东西以语言(提示词)的形式描述出来,然后模型根据这份文本生成对应的视频。我们按照文本的语言容量通常是几十到几百 KB 估算,生成的视频则是几兆(MB)到几百兆不等。前后相差几百到上千倍。
按照信息熵理论,信息不可能以如此大的压缩率无损缩放,过程必然涉及对原本信息的篡改,包括补充、粉饰和舍弃。
从高熵到低熵丢弃的过程很好理解。我很推荐你收听重轻的《不在场》播客第二季第一集节目,这是我见过的对「有损压缩」解释得最好的节目;而反过来,从低熵补充信息到高熵,就是模型在做的事情。毕竟没人会把每个像素点的 RGB 值直接扔给模型——那也不需要模型,直接扔给显卡就好。
如果要探究从提示词文本到多媒体内容,模型究竟在做什么,飞天闪客一期关于视频生成模型的节目和 HEM Records 的探究(当时的)AI 能做到什么样的音乐的节目,某种程度上就在讨论这个问题。给没有看过这两个视频的朋友们简单解释一下节目的中心思想:与我们认知中「说得更详细就能得到更好结果」不同,说得越模糊、要求越低,模型做到「符合要求」的可能性越高。(如果你还是不能理解这个逻辑,十分推荐分别点进这两个视频,都看一遍。)
大语言模型本身没有任何的创作能动性,即使是「小步快跑也在超速进展」的生成式模型,它所做的也只是「将人类的文明做一个平均数」。连加权平均也没有。
因此大模型在「要求不高」的提示词中间的缝隙中,填充的就是「人类文明的平均数」(用 fancy 一点的话来说,我们会管这个「平均数」叫做「幻觉」);我们从模型里收获的东西,也只能是「带使用者审美」的「人类文明的平均数」。
但人不是。
人在创作上可以有偏见(bias)、可以有自我审美、可以有艺术滤镜,生成式人工智能之前的世界有着无数个这样的「认知裂隙」,事实上造就了人类文明历史上大量的细分艺术形态和风格。
如果把生成式 AI 拿给拥有正常的审美和强烈的自我表达意识的创作者们,他们几乎不会担心使用 AI 会对自己的艺术造成什么影响:对他们而言,它只是一个创作工具,仅此而已。但对更多的创作者来说,问题就会更严重一些。但这个问题早在模型出现之前就已经显现。
生成式审美反刍
我们前面提到,生成式 AI 模型们创作的时候更喜欢「模棱两可的地方比较多」的指令,这样它们就有办法将自己学到的「平均数」都塞到输出结果里。而在信息传播过程中,这些填充的信息同样会被其他同为受众的创作者吸收。
往坏了说,如果所有人都用平均数来创作,最终会令世界上所有的创作都变成了「平均数生成比赛」。
和 Claude 讨论了一下这个想法之后,我决定将这个过程称作「生成式审美反刍」,Claude 建议我把它的英文描述确定成「Generative Aesthetic Rumination」。它的意思是,在生成式人工智能广泛应用的环境下,人们利用 AI 在提示词里填充泡沫塑料(填充信息熵),然后这样的信息熵会被人们反过来吸收。
最终,泡沫塑料本身成为下一个作品中表达的一部分,经过再创作、再吸收,泡沫塑料也会在最后变成审美的一部分,达成一种「递归」式社会审美趋同的效果。
但正如我之前所说,「生成式审美反刍」并非是凭生成式模型一己之力造成的问题,这个问题早在媒介变化的过程中就已经显现。从传统报纸电视、博客、RSS 到之后的视频网站、短视频,这个过程中信息熵都是在急剧压缩的。特别是由字节跳动以来的互联网,人们亲手开启了「推荐算法」的潘多拉盒子,以及「注意力经济」速来快走的特性,令「调动人们的兴趣」成为了一条有且唯一的成功捷径。
此时「用平均数」就成为了所有创作者的「平均数」。
你能做到的事情
除了《女神异闻录 5》(Persona 5,P5)本篇,我同时也很喜欢同代的支线作品《女神异闻录 5 乱战:魅影攻手》(Persona 5 Strikers,P5S)。我甚至认为,在故事立意上 P5S 是可以和本篇平起平坐的。因为 P5S 的故事设定是「所有人都有一个无所不知的 AI」,而这刚好就是 2022 年末以来,以 LLM 为首的人工智能大跨步跃进后的世界。
P5S 故事的最后,「叛变」的 AI 索菲亚最终在与怪盗团的行动最后,看到了在涉谷烟花,更确定了要成为「人类的好朋友」的目标。但现实是,现在的 AI 模型只能躺在数据中心的服务器里,以人类的平均知识和平均价值观「和稀泥」。
它无法真正感受现实世界,无法培养真正的审美,无法做到有偏见(bias),更谈不上任何的能动性。
但你还可以。如果你觉得你要将这份珍贵的礼物用来给 AI 跑腿,那我尊重你的选择;不过你有另一条路可以选——你可以自己去感受这个世界,用眼睛、用腿、用你一切的感官、工具、甚至是 AI 去感受这个世界。
你有 AI 彻底做不到的事:审美、经验、精神,这些都是躺在数据中心的模型望尘莫及的东西,即便他有无量大数级别的参数,也无法替代这件事。
所以,去感受、去思考、去创作吧。这是只有身为人类的你能做到的事情。
> 关注 少数派小红书,感受精彩数字生活 🍃
> 实用、好用的 正版软件,少数派为你呈现 🚀


