AI图像生成与版权纠纷

AI生成图像的著作权认定问题

最近小红书和各个媒体上逐渐看到很多创作者声明抵制AI(主要以画师为主),最常被拿出来讨论的是AI作品涉及到的侵权风险,以及AI生成的作品是否享有著作权。
后面这个问题似乎相对更加明了,最近美国版权相关机构公开文件表示著作权主要保护人类的创作,完全由AI创作的作品(如直接由提示词生成的图像)不受保护,但是经由人类编排之后的作品(如AI图像组合的漫画作品)则可以申请著作权保护,但需要经过机构审核。
尽管如此其在实际操作过程中的模糊性依然存在,比如之前网络上曾有借助ChatGPT将一个简单的故事框架生成详尽的分镜描述然后使用Midjourney生成图像的流程,人类在其中的创造力如何衡量,以及如果创作者决定隐瞒如何检测故事是否由AI生成……种种问题依然接踵而至。

AI生成图像的侵权认定问题

而回到前一个更被普遍关注的问题则面临更难以解决的困境,保守的画师一般认为现在的AIGC技术是对学习材料的拼贴,同时寄希望于一种能识别图像是否由AI生成的工具来裁断这个问题,从而使著作权得到充分的保护。但这样的理想可能是难以达成的,原因主要在于从技术上回溯生成的图像受到哪些训练集图像的影响在现阶段几乎是难以实现的(没有可解释的方法帮我们打开AIGC的黑箱)。还有另外一个原因是人机协同的工作流程已经逐渐出现,如上面所讨论的,怎么判断一个作品是主要由AI创作的将会是一个难题。
有一些研究者采用一些测量图像相似度的方法验证出由AI生成的图像大概有10%左右的比例与既有图像存在高相似的情形,这在以往的侵权判例中可能行之有效,但是面对即将到来的未来而言可能很难成为认定侵权的技术方案。
我们想象一下即将到来的未来会是什么样子:AI可以从人类历史所有创造的二维图像作品中学习到内在的结构关系,然后借助庞大无匹的算力穷尽所有二维空间作品的可能性。最近经常听到人们谈论到刘慈欣的《诗云》,这无疑不在说明这样的情景,当把世界上所有文字组合穷尽的时候,所有的诗也就在那里了,只是没有办法找寻出来。
以往历史中我们创造作品的生产力是有限的,所有的作品在高维的空间中是稀疏的,相对而言我们能容易以“相似度”这样的形式去判断侵权与否,但是以后由AI带来的创作力井喷,高维空间将快速地被大量作品填充而变得连续,相似度的标准就会变得十分模糊且难以操作。

版权保护了什么?或者说创作是什么?

返回来想,如果真的有那么一天所有作品的组合已经被AI穷尽会怎么样?当一个人类下笔的一瞬间AI就能找到和他画得一样的“既有作品”。这让我想到几年前出现的一个基于Google map开发的网页游戏,玩家可以用鼠标在界面上随意绘制,然后瞬间你的笔触就会成为山川、河流、公路、海岸等等真实存在的地图中的地物边界。到那个时候创作到底为何物?可能创作并不继续侧重在制作出了某物,而是“发现”了某物,甚至是“诠释”了某物。人类的真实性、故事性、诠释性可能是与AI交锋过程中最后壁垒上的一段城墙。

大语言模型对于知识型劳动的普遍冲击

通用人工智能对知识型劳动的影响已十分显著

另一方面,由大语言模型带来的冲击尽管并不在版权这样的法律层面受到关注(可能由于知识和语言的归属权本身并不受典型的法律体系保护),但是大预言模型表现出来的各种能力所影响的领域则是更广泛的,不禁让人们觉得这是通用人工智能(AGI)的一块新的里程碑。
在OpenAI最新公开的预印本论文《GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models》中研究了GPT对于现存的职业工作的影响程度,表明80%的职业将受到10%以上的影响,而19%的职业将受到50%以上的影响。这其中高门槛,高收入的职业受到的影响更大(传统的知识密集型职业),另外对于编程、写作、新闻传媒、数据分析、信息处理等职业的影响将达到极高的水平(接近100%)。

反思:什么是“创新”?

之前看渐构大神b站上的视频《万字科普GPT4为何会颠覆现有工作流;为何你要关注微软Copilot、文心一言等大模型》着实被震撼良久,其中的一些观念一直萦绕于心。他认为大语言模型(LLM)涌现出来的能力一定程度上已经可以取代以往我们认为的“创新型”工作,所以对于今后(特别是教育领域)最大的挑战在于区分AI可以带来的“创新”以及“更高层次的创新”,并且着力培养“更高层次的创新人才”。
一个我们不得不直面的问题是传统的“创新性”“创造性”工作受到了前所未有的挑战,我们原本希望AI替代枯燥无味的重复性工作,但是最先受到冲击的反而是以往认为偏“知识型”“灵感型”的工作。就像我从去年AI绘图刚刚萌芽时候产生的感觉一样,这一波AIGC的大跃进是对于我们以往建立的很多体系的解构,包括对于创造性的解构,对于艺术的解构……当然这样的解构或许更能反思这些我们以往习以为常的概念到底在这个时代应该被赋予什么样的内涵。

由此带来的劳动力变革

每每想到深处我总是不可避免地陷落到对于劳动力变革的忧虑中,不仅仅是担心自己的工作、职业在未来可能会面临的变化,而且是这势不可当的技术潮流下必然会发生甚至已经发生的劳动权益受损的现象。前面讨论的版权问题我并没有觉得那么理所应当,因为已经有相当一部分人的切身权益受到侵犯,而这种权益在以往的规制中是合法合理的。
大规模的替代是否会集中地出现?或许已经有局部的现象,只是伴随近两年本身就不乐观的求职市场和相当规模的摩擦性失业,现在由技术替代所造成的失业还没有那么显著。
最近还经常会想的一个问题是AI到底是让我们的“狗屁工作”变得更多还是更少了?从个体来看技术工具似乎会带来效率的提升,以前很多重复性的以及低智能的工作已经可以被工具胜任了,那么似乎我们可以着眼于“更具价值”的工作环节了。但从群体角度来看如果AI真的取代了相当数量的传统岗位,为了让社会平稳运作不至于出现危机,在没有新的增长点用来容纳这么多劳动力的时候,可能不得不出现更多的“狗屁工作”岗位(起码我认为传统科层体制中大量的中层都是这么出现的)。

是不是应该反过来更重视教育?

而另一个由技术替代所带来的问题则慢慢出现:现在我们都说一些知识型岗位的中低端岗位可以被AI替代了,企业主甚至有想法裁掉80%的员工以降低人力成本,但是所有的中高级技术人员都是由低级成长而来的,如果企业不招收和培养新员工就不会有将来的骨干员工,而现在的哪个新员工会在将来成长为重要的骨干这类预测往往存在随机风险,所以不能寄希望于招收的20%新员工在将来成为等量的骨干成员。
这就带来一个普遍的问题:或许更应该加强的是职业化教育。现在这场变革就像在蛮荒时代外部环境变得逐渐恶劣,对于个体独立的要求变得更高,所以种群需要对个体付出更高的培养成本。明确来说就是社会有义务教育人才成为“更高层次的创新人才”,而这样的教育过程会在哪个阶段,无疑又会陷入各种讨论。
这似乎回到了刚才渐构所说的那个问题,就我个人看来,企业或许需要做好更健全的职业化培训的准备。因为寄希望于传统教育体制或许在短时间之内是不可期的。

零碎地说了很多最近的想法,不成系统也没有什么结论。仅仅是想写下来卸掉一些思想的包袱。实话实说近期在信息上的压力十分大,不想错过很多事情,但同时又想不清楚很多事情。这里只写了一些对观察到的现象、接触到的信息的思考,并不涉及到个人的决策。对于个人来说要怎么做其实还在一个相当迷茫的状态,不过我已经决定更进一步地回归到个人本身的诉求,或许之后会有一些结果。

0
0