说 2022 年是生成式 AI 的爆发之年,应该是恰如其分的。尽管基础设施、数据集和模型等上游环节已经经历多年积累和发展,但今年的特别之处在于涌现了一批「多才多艺」、具有惊人理解能力和创造力的模型,以及基于这些算法构建的应用界面。这些新技术的作品既让公众惊讶赞叹,同时也让 AI 是否会取代人工等经典问题再次成为讨论热点。

作为技术尝鲜的先锋队,少数派用户在这场 AI 盛会中自然不会缺席。去年底以来,社区中 AI 主题的分享明显增多。这些分享从体验、测试到感悟、反思,比较全面地覆盖了近一段时间的热门 AI 产品和热议话题。在此,我们挑选其中反响最好的一些文章整理汇总,以飨读者。如果你也对 AI 感兴趣,阅读这些分享一定能让你收获一些新知、共鸣或触动。

博采众「奇」

少数派作者中,对 AI 兴趣最浓厚、涉猎最广泛的大概要数 @玉树芝兰 老师。跟随他的脚步,我们不仅在第一时间看到了各个「爆款」AI 产品的抢鲜体验,还了解到了很多虽然名气没那么大,但效果同样惊艳的算法和模型。他的文章包括:

和 ChatGPT 谈笑风生:

 

用 DALL-E 将朴素的语言画成天马行空的想象:

 

用 Lex 跨过创作者头脑卡壳的难关,通过已经写的内容自动生成「下一句」:

 

用 Autocut 通过编辑字幕来剪视频:

 

以及用普通电脑就能跑的基础款模型 BRET,自动寻找卡片笔记之间的关联:

 

此外,作为大学老师,他还分享过 AI 技术在学术方面的多种应用,例如用 Elicit 高效寻找研究选题用 Explainpaper 辅助读论文 等。

当然,对 AI 感兴趣、愿意折腾和钻研的少数派作者绝不在少数。例如,很多文章为想要亲自体验 AI 产品的读者提供了图文并茂的上手指导:

@清顺 提供了在自己电脑上使用 Stable Diffusion 的手把手教程:

boxcn9gyS9rb1fTLjXQxOlGoG4H
 

(Apple silicon 系列 Mac 机型的专用方案则可以参考玉树芝兰的教程。)

以及如何用 Whisper Whisper 会为音视频生成带时间轴的字幕文件,从而不懂外语的也能看懂外语剧:

boxcn775FSnn59GxsdubX641wWh
 

@100gle 在 GitHub Copilot 正式版上线之后,第一时间详细介绍了自己从内测起使用近一年的体验,肯定了 Copilot 在提供思路和提高效率方面的意义:

 

他还介绍了怎样用 colourise、DeOldfy 等工具,轻松修复老照片,让黑白照片焕发新生:

 

@宛潼 介绍了微软出品的 AI 设计工具 Microsoft Designer,普通人点点鼠标就能创作出审美过关的设计稿:

 

@Kiririn  介绍了怎样用 waifu2x 为图片「摘下面纱」:

 

集思广益

值得注意的是,在尝试 AI 工具的过程中,少数派作者也充分发挥了批判性思考的少数派精神,并不满足于仅仅把玩 AI 工具并对其展现出的潜力发出惊叹,而是在此基础上进一步反思,对于 AI 与人的关系、未来的分工等问题各抒己见。

例如,玉树芝兰经常在介绍 AI 技术的同时,一并讨论自己对这项技术有什么作用、与人工的关系、怎样最好地利用等问题地思考。

对于 DALL-E 是否会让艺术家失业,他认为:

艺术家不会失业,他们会和 AI 联合,把工作做得更高效,进一步挑战人类创造力的边界。但是,那些从事非艺术的绘画创作的人,可能会遭受到职业危机。另外,我在想,DALLE 这样强悍的工具出现,对于学术论文图的造假,会意味着什么?我能想到的,是用技术对抗技术。只有同样见多识广的模型,才能打败这种违背学术道德的「无中生有」。

谈及 AI 辅助学术研究的限制,他说:

不要对 Elicit 直接给出的回答有过高的预期。我们可以把 Elicit 发现的局限,转换成为新的问题,让 Elicit 在海量的研究文库里面,帮咱们寻找别人的研究成果,以便确定它们是不是有价值的真问题,或者是不是已经被人捷足先登。这样,你可以少走很多弯路。举一反三,试试看吧。

关于工具辅助与头脑思考的分工,他提出:

知识创造的目的,不是为了勋章,而是为了满足好奇心,为了把世界变得更美好一点儿。应该「万类霜天竞自由」,而不是所有生物一起去比爬树。这才是打破内卷的有效方式。「懒」是我们的特性,不是一种罪错。工具如果能让我效率更高,我就充分使用,不需有丝毫的负罪感。只是注意「以物养己」,而不要「以物役己」,就好。

同样,在讨论 GitHub Copilot 时,100gle 在介绍 Copilot 功能和体验的基础上, 讨论了「代码未经同意被喂给机器学习」「被坏人教坏怎么办」「反刍代码的版权问题」等主要争议:

一年以来,发声批评 Copilot 模糊立场的声音此起彼伏。另一方面,一些乐观的观点认为,对于那些相对较短的建议片段,使用者可以根据合理使用的原则免予征得授权;还有相对激进的观点认为,这种机器生成的代码不是「智力创作」,因此不构成著作权法意义上的「作品」。

当然,正如任何 AI 相关的知识产权问题一样,疑问远多于答案,留白远多于规则。动用常识、手动核查、谨慎接受,仍然是更加保险的做法。

此外,也有很多作者直接从更偏理论的角度切入,结合对 AI 话题的学习研究或关联行业实务提出了看法。

谈及《在 AI 绘画的世界里,怎样才算一名合格的「甲方」?》,@小秋夫斯基 分享了自己在体验和学习 Midjourney 过程中,获得的经验和感想,特别是人在 AI 绘画过程中所起的作用:

优秀的 AI 绘画作品是需要人们去思考如何用具象化的语言表达出抽象化的思维,并对其中的细节做出优化,这个过程无法脱离人的干涉。即使 AI 绘画技术再高级,空空如也的脑袋里诞生不了深刻的作品。

AI 绘画是一门关于协作和表达的艺术。如同计算机编程语言一样,它能做到的是帮助你和电脑沟通,利用电脑快速地展示你的所想所需,图像的生成和迭代是将作者脑中所想所感表达出来的过程,因此想要完全掌握 AI 绘画并不比学习绘画容易。

 

在《AI 创作的重重争议》中,@PlatyHsu 根据近几个月 AI 创作相关的新闻事件,总结一些该领域目前争议较大的问题,并厘清一些名词和概念的对应关系,提出应以一种审慎但开放的心态看待 AI 创作。

AI 生成作品的权利如何归属?艺术史不是没有见证过类似的问题;马塞尔·杜尚的小便池和安迪·沃霍尔的罐头在问世时也是充满争议,但最终没有像时人担心的那样摧毁艺术,而是扩展了艺术的定义。一种可能的回应是,AI 使用者在编写文本提示词方面做出了创作性努力,从而为其享有作者权利提供了正当性。

一种比较有新意的提法来自《新物种》(The New Breed)一书,该书主张在处理人和人工智能的关系时,参考人和动物的关系,例如像动物饲养人对动物的「肇事行为」承担责任那样,要求使用者对 AI 创作的侵权后果承担责任。

 

在《人工智能之死》一文中,@leon_ye 回顾了 Cortana、Jibo、Tay 等失败或关停的 AI 机器人, 引导读者思考人们在理解 AI 时的拟人化倾向,包括为 AI 想象和建构生死观,用人文社会框架探讨 AI 行为等:

人工智能也会和我们一样拥有道德伦理观吗?人工智能应该有怎样的行为准则,才不会去决定他们创造者的生与死?人工智能有生或死吗?等等。我们很可能永远也无法得出这些问题的确凿答案,但探寻这些问题、尝试着去理解的过程本身便已有着足够重要的意义。

 

在《当 AI 能代替我们写作,我们还有什么?》中,@猴猴说话 重点阐述了「AI 不能代替我们对内容的审美」这一观点:

倘若作者的审美和沉淀不够,反而会出现被工具主导,甚至被代替的困境。AI 写不出我们的经验和故事,也写不出突破自我体裁的反思,程序的设计就需要遵循规则,而创意、活力、艺术的存在则正好是打破规则。不论是创新度、个性度、思辨度,AI 都无法胜过创作者;这也是我对好内容的评判标准。

 

在《从起因到争议,在 AI 生成艺术元年聊聊 AI》中,@四喜茶茶 从设计师和绘画爱好者的视角,讨论了 AI 生成艺术爆发背后主要的技术原因、AI 用于 UI 设计 的可行性等问题。

AI 生成艺术虽然看起来「想象力丰富」但却不「精确」、不「稳定」,但这其实是「工程」问题而非是 AI 的能力限制。如果把绘画当做描绘内心与表达自我的一种手段,AI 生成其实也是一种手段, AI 艺术创作者也会在使用 AI 的过程中得到自己的「心流体验」,体会到用 AI 创作的乐趣与艺术的美。

 

在《「一颗柠檬戴着墨镜在沙滩上休息」—— 人工智能请创作》中,@沙丘研究所 讨论了「想象力与创造力」「署名权与自主性」「量产」等 与 AI 难解难分的问题,进而将 AI 技术与一百年前摄影技术对于绘画的冲击相比较,提出 AI「为我们提供了一种不同于人类创作的思考方式」。

与其将 [AI] 作品看作是对于人类涂鸦的一种模仿,它或许可以被理解为一种对于人类创造性为的重新思考——或许人类的创造力也并非来自人的理智和主体能动性。这些都使得「想象力是自然的而非人工制造的」这一命题变得不再稳定。如果我们认为 AI 所做的不是新的,我们又如何辩驳人类的想象物就是新的,而不是多种已有元素的再组合?

 

在《AI 作曲》一文中,@陈东泽  科普了 AI 作曲的原理:旋律被符号化为 MIDI 数据,得以数字序列来表示;这被丢进 AI 的「盒子」,经过神经网络的演算,最终输出新的数字,重新转换成 MIDI 文件,变成 AI 创作的音乐。

AI 作曲,是理性世界向感性世界发起的挑战。但是,世界未必是一元的,情感与意识也未必由物质所决定,当下没有人知道正确答案。AI 与艺术的融合虽更依赖基础科学的突破,但美的确有迹可循,当下 AI 创造的艺术作品也 [已经] 是丰富多彩的。这是科技与艺术融合的极佳领域,也是统一数字与情感的探索路程。

 

 

在《AI 数字绘画:何时从 AIGC 迈向 AIAD?》中, @樊川_MinusType 用大量环境规划设计的实例, 谈了自己对于人工智能辅助设计前景的思考,认为这一代的 AI 生成图像相对于上一代来说较为突出的优势是已经可以生成「基本不违和」的图像, 但更为细致的和高要求的生成,则依赖于设计师学会「如何和 AI 对话」;此外,无法理解空间也是目前水平的 AI 用于环境设计的一大限制。

AI 绘图的技术能帮我们看到更多可能性的还是在表现上面,传统的「建模-渲染」流程,效率和效果都差强人意,AI 绘图的特点正好能在这些方面进行弥补。对我们 [设计师] 而言也可以通过调整预设风格,输入更多相关的图像调整模型,设计更适合设计师日常交互的工具等方式来让眼前的这一步走得更快。

 

AI 从业者 @调皮的王登科 所在机构基于两千多份问卷调查和对行业人士的访谈,尝试做出了《中国AI绘画行业调查报告——技术,用户,争议与未来》,通过数据观察了AI绘画的用户画像、平台和工具的商业模式、用户目前主要关心的争议和问题,并对潜力和未来做出了预判。

AI 绘画服务在 To B 领域天然拥有更多可能性。[虽然] 受限于模型质量,版权争议,以及目前较早期的技术阶段,还很少有公开落地的案例,但我们认为在广告行业、素材库、辅助工具、营销定制服务、线下实体结合服务、元宇宙等线上虚拟空间等方向,可能会在未来涌现出更多 To B 的成功案例。

我们提倡,如果在生成 prompt 中指定了在世艺术家,那么至少应该将AI生成的图片以 CC0 协议发布,同时应该保留艺术家的相关信息,并且在得到艺术家授权前,尽量不做商业用途。

 

你对于 AI 工具有怎样的体验?对于 AI 技术未来的角色有怎样的思考?欢迎通过评论和文章与大家一起分享。