开源和闭源孰优孰劣是一个人们争论不休的话题。许多开源爱好者喜欢举着“开源永存”的旗帜为开源摇旗助威,令人充满激情。但现在看来,闭源好像是现阶段唯一的“最优解”。

注:本文为个人观点和想法的输出,如有不同意见,欢迎在评论区中友善讨论。


引言

近期,大模型领域关于开源的新闻可谓是铺天盖地。从 Elon Musk 旗下的 xAI 公司在官网宣布开源拥有 3140 亿参数的大模型 Grok-1,到研发出开源绘图模型 Stable Diffusion 的 Stability AI 公司 CEO 突然宣布辞职并退出董事会。这些新闻,一时间把开源大模型推上了风口浪尖。

xAI 官网对于 Grok-1 开源的报道

但 Grok-1 开源之后,好像并没有想象中的那么“一呼百应”。根据 Google Trends 的数据,在 3.18 日时,搜索指数达到了“100”,而到了 23 号时,搜索指数已经急剧下滑到了 14,甚至比宣布 Grok-1 开源前的搜索指数还要低。

数据来源:Google Trends

而在图像生成领域的“稳定AI”(Stability AI) ,好像也不怎么 Stable。 公司的领头人 Emad Mostaque,既不再担任CEO,同时也退出了公司董事会,并在 Twitter 上宣布要投身于去中心化与 AI 开放(#decentralizeAI)的事业之中。

Emad Mostaque的推文

不过,Stability AI 的混乱远不止于此,据澎湃新闻统计,从去年3月至今,已有至少19名高管或关键人物出走。CTO 也也刚刚换新,据称随着新 CTO 的上任,公司战略可能向语言模型偏转。另有消息称,Emad 还被曝出过拖欠员工工资、诓骗投资人等“黑料”。 其近期的混乱与不稳定,与名字的强烈反差倒是显得极为讽刺。

所以,作为观众的我们,应该尝试着在这场大模型领域的开源闭源之争保持理性。本篇文章,将会站在我个人的角度,尝试着去分析这个“争端”,并给出一个我认为的答案。

开源与闭源

要想聊大模型领域的开源和闭源,就先需要明白开源和闭源本身。

开源(开放源代码),根据维基百科的定义,是一种在电脑程序出品前和开发中提供其内部代码的做法。开放源代码使得生产模块、通信管道、交互社群获得改善。一个开源软体开发的主要原则和惯例是易货贸易和合作的同侪生产。

Linux 系统:典型的开源产品代表

而闭源(另称“专有软件”),则是由于商业或其他原因,不提供原代码,只发布只有计算机才能读懂的程序(如二进制格式)。

用一张表格我们就可以清晰、明了的知道两者之间的区别:

方面开源闭源
定义开源指软件的源代码是公开的,并且允许任何人查看、修改和分发。闭源指软件的源代码是私有的,只有软件开发者能够查看、修改和分发。
商业模式

资金来源主要包括风险投资、捐赠等;

开源软件主要通过为企业提供开源软件的咨询和解决方案,收取咨询费用,提供技术支持、培训、定制化开发等服务赚取收入。

资金来源主要包括投资机构的投资或少数情况下的捐赠;

闭源软件通常采用许可证销售模式,用户需要购买许可证来使用软件。

优点
  • 社区参与,代码透明,安全性高
  • 成本低,可定制性强
  • 保护知识产权,控制软件使用权
  • 技术支持可靠,稳定性高
缺点
  • 商业化可行性较差,盈利模式不明确
  • 维护更新依赖社区支持
  • 缺乏透明性,难以排查漏洞
  • 依赖软件提供商,成本较高 
典型案例Linux操作系统、Apache Web服务器、MySQL数据库Windows 操作系统、Photoshop 图像处理软件

从上表中可以看出,开源的优势在于社区参与度高、可定制性强,而缺点则在于商业可行性较差、严重依赖于社区;而闭源的优势则是技术支持可靠、保护知识产权,缺点则为缺乏透明性及成本较高

在传统的产品和软件中,开源和闭源各有自己坚定的拥护者和“杀手级应用”。开源的拥护者们,例如 RedHat 社群高喊着“开源万岁”口号,认为开源能够推动软件生态的健康发展,让开发者“少造无意义的轮子”;而最终选择闭源的开发者,例如Elvic Liang则认为开源软件的商业化模式是一个极其复杂且成功率极低的事情,选择闭源才是对自己和用户负责的最优解,不至于让一个产品因为开源导致了最终无人维护。两个方案在传统的产品和软件中都有一定的可取之处,至少无论选择哪种方案都不至于让自己的产品走向一条“不归路”。

然而,到了大模型这个领域之后,一个值得注意的问题是:在其他软件类型或领域中开源的优点,在大模型领域中还是优点吗?

大模型的闭源,在现阶段或许是必然

前文中提到,近期 xAI 开源了自己的语言大模型 Grok - 1。在第一财经关于 Grok-1 的报道中提到,大模型厂商开源的动力主要是招揽客户,做影响力。而其目的则是让企业免费试用一段时间后,引导其向市场发布包装后的功能或者服务,这个东西(大模型)也相当于汽车里的发动机,直接用不起来,需要包装成整车。

然而,开源自己的大模型对于开发厂商的不利之处也有很多,主要有三:

首先,大模型产品 to B 的逻辑与传统软件有本质上的不同。在传统的 App 中,一个公司的产品对于开源软件的依赖,可能是由于底层使用了某个开源软件的代码;但在大模型领域中,唯一能够让闭源大模型被公司产生所谓“技术依赖”的,可能也就是公司自己使用大模型的训练集和代码进行进一步的“个性化”训练。

但这个“个性化”训练所产生的壁垒,也会随着通用语言大模型 Long Context (长文本) 能力的提高而逐步消失,这也是 Moonshot AI 的 Founder 杨植麟所选择的路线。这也就意味着,随着技术的提高,公司逐渐的就不会对某个特定的开源大模型产生强绑定式的依赖性。

Kimi 智能助手近期支持 200 万字上下文,是典型的 Long Context 代表

其次,现阶段大模型领域的商业化产品一般都是以调用大模型 API (程序接口)的 Token 数付费的逻辑,而非付费购买、使用产品的逻辑。而这就导致了公司极低的迁移成本:公司只需要发现性价比更高的API后,迁移所需的资料、Prompt 到新的平台上即可。因此,使用大模型的公司可以“货比三家”,选择最为合适的大模型,而开源对于选择的权重则会降低。

OpenAI API Platform 截图

最后,现阶段的大模型主要比拼的是模型质量的提高,而模型质量的提高则是需要大量的金钱来堆砌的。开源软件由于其特殊的商业模式,有些甚至很难产生盈利,因此投资机构会较为谨慎。但闭源软件由于其商业模式较为清晰,较容易得到融资,因此大模型厂商的资金来源充足,可以将精力完全投入到模型的研发上,因此模型能力更容易快速提升。

元能力引擎,IDC Market Glance:中国AI大模型市场概览报告正式发布
IDC:中国AI大模型生态图谱(V1.0)

目前的技术曲线还是线性上升的,而只要是线性上升的状态,那么开源大模型绝对追不上闭源。虽说如果未来碰到性能墙了情况就另当别论,但目前的 Scaling Law 还能到哪,目前无从知晓。

例如,现阶段的独角兽公司,如 Moonshot AI、MiniMax,和老牌的互联网公司的大模型产品,如文心一言、讯飞星火、腾讯混元等均为闭源模型。而例如像智谱 AI 这样的独角兽半开源(同时有开源模型和商业模型)大模型厂商,其 CEO 张鹏也在接受记者“AI 科技评论”的采访时表示:

Q:内部怎么看待开源?

A:开源是智谱重要的事情,最新成果都是以开源的方式放出来,再有商业的版本。符合开源先行的理念。

Q:如何看待开源与商业的关系?

A:开源的目的和商业不要混为一谈,开源和商业化是整个生态版图里很重要的两块,这两块是有连接的,可以说开源充当着商业化的桥梁。

Q:开源模型越来越多,对智谱有哪些影响?

A:开源的多了,大家就多了一些选择。可以不用商用的版本,客户直接用开源的版本就好了,但这件事有好有坏。好处就是说可以低成本、快速地切入使用上大模型,但开发者也知道社区支持这个事情永远是一个雷,开源大模型在安全性、稳定性等方面很难得到保障,这也是商业版本能够与开源版本并存的原因。商业版本可以提供更多的服务,更多的保障以及更多后续的服务,这些开源版本不一定有。

Q:对于开源和闭源大模型,用户应该如何选择?

A:得看他的目的是什么。如果他只是想做一些实验和尝试,那选开源模型没问题,如果想要在上面做一些商业化应用,我觉得大部分人还是会选择商业化版本,因为有保障,能够提供更好的服务。

可见,其内部对于 AI 的开源和闭源的关系认知为:

  1. 开源与商业化的分离:他们认为认为开源和商业化是两个不同的领域,它们各自承担着不同的角色和目的。开源主要是为了分享技术成果、推动技术发展和创新,以及建立社区和生态。而商业化则是为了提供更加稳定、安全的服务,满足特定客户的需求,并确保公司的持续运营和发展。
  2. 开源作为技术发展的桥梁:智谱将开源视为连接技术发展和商业化之间的桥梁。通过开源,智谱能够吸引更多的开发者和研究者参与到大模型的创新和优化中来,从而推动整个行业的进步。同时,开源也有助于提升智谱的品牌知名度和影响力。
  3. 闭源满足商业需求:智谱认为闭源的商业版本能够提供更加专业和定制化的服务,满足客户在安全性、稳定性、技术支持等方面的需求。这对于商业客户来说是非常重要的,因为他们需要确保使用的技术能够带来实际的商业价值。
  4. 开源与闭源的互补性:开源和闭源并不是对立的关系,而是相互补充的。开源可以促进技术的快速迭代和创新,而闭源则可以确保技术的稳定性和安全性,满足商业化的需求。两者共同构成了一个健康、多元的技术和商业生态。

如果用一句话总结智谱 CEO 张鹏的观点:开源和闭源不是对立的,而是相互补充的,开源推动技术创新和生态建设,闭源满足商业化需求和提供稳定服务,共同促进大模型行业的健康发展。

除此之外,年初以来大热的 AI 公司 —— Moonshot AI (月之暗面)的创始人杨植麟先生去年十月接受极客公园的采访时也提出:“闭源是通往超级 APP 的唯一通路”。同时其认为,大模型领域的开源本质上是 ToB 的获客工具现阶段面向于C端的头部 Super App 一定是基于自研的模型做出来的,Moonshot AI 用闭源的方式做,是持续演化的过程。

Moonshot AI CEO 杨植麟汇报 Kimi Chat 产品

综上三点,从目前的情况来看,大模型的闭源在一定程度上似乎是不可避免的。尽管开源大模型可以推动技术的创新和生态建设,但闭源模型更能满足商业化需求,提供稳定的服务。

结语

写到这,或许已经对大模型厂商开源与闭源的未来有了初步的判断。现在,中国的 AI 公司可谓“百花齐放”,而更为关键的是,目前对于公众来说,AIGC 领域也是一片蓝海。因此,正如之前的“单车大战”、“充电宝大战”、“团购大战”等一样,对于现阶段的每个 AI 厂商和它的竞品来说,用户的数量和模型的质量永远是排在第一位的存在。

因此,虽然可能令人有些沮丧,但闭源的大模型似乎现在看来确实更有前景,而开源的大模型获得真正的成功,或许在当下,只是一种奢望而已。