上篇文章(中文播客的前世今生)发出后,发现很多朋友对于结论环节,即中文播客未来的可能性非常关切。其实行文到那里的时候确实还有些想法,但顾及篇幅过长所以有所保留。这篇文章就浅析一下「理想状态下短播客的可行性」。

短视频主宰了视频,那么短播客会是播客的未来吗?

还是从与前文同样的角度,即决定了目标受众的市场环境、连系着播客主播的平台、定义了短播客性质的内容三个角度来谈。

市场:增长来自何方

首先是市场环境。

谁更能满足需求?用户会用脚投票

上篇文章已经讲过许多,CNSA 的数据表明,中国⽹络视听行业的总体用户规模,也就是天花板,基本上是靠短视频用户撑起来的,而网络音频用户规模基础还是相对薄弱。

喜马拉雅作为音频行业的行业老大,目前仍挣扎在上市和亏损的困难之中,中文播客的数量级要比喜马拉雅还要低很多,就算未来成为音频界的主流,想要变成更加成熟的市场、有完善的产业链和商业变现能力亦是艰难重重。那也就是说真正的增长一定是和短视频抢用户。

换句话说,中文播客一定要从目前的用户群拓展到抖音快手等短视频平台的用户群。

倘若继续维持目前的发展,对头部播客来说或许已经足够,主播们可以接受一定程度上的用爱发电;但对平台来说只能烧钱补贴,是无法坚持的。所以喜马拉雅和荔枝都在部分地割舍播客业务,而小宇宙目前的增长多半也是来自于这些 2012、2013 年前后成立的平台流失的用户,长远来看难以为继。

平台:何以承载创作

但此刻不成熟的播客市场所面对的问题,也是曾经的视频行业早已经历过的。我们来看看视频平台是怎么做的。

对比视频市场

视频曾是一个被电影和电视媒体垄断的纯 PGC 媒介,普通人难以企及。后来有了数码相机、便携且相对便宜的视频机,PUGC 才慢慢多了起来。而手机出现后才催生出真正的 UGC。

乔布斯在 2001 年的时候曾接受过日本节目的采访,谈论到自己制作的家庭视频,主持人问他,这样的事情是不是只有像你一样富有创造力、适应数字生活的人才能完成,而大多数普通人根本无法做到呢?乔布斯说,生活中有太多阻力试图把我们定义在制度之中,人们常常会忘记自己有多特殊……当数字化时代来临,我们需要去满足用户在报表和邮件等工作以外的日常生活的需要。

商业上最先成熟的是 PGC,但最大的想象空间来自 UGC。而从左到右,按时长来看,视频也可分为短、中、长三个类别。

设备与创作者

类比到播客行业,UGC 的主要创作工具就应该是手机 + 耳机;PUGC 是千元内的麦克风、录音笔。PGC 是可供多人录制的、包含一系列设备的录音棚。京海派时期的许多主播曾经带动过电容麦克风等 PUGC 设备的流行,但近两年的头部播客几乎都是使用录音棚录制节目,创作设备方面没有进一步下探。手机的录音音质是一个比摄影的成像素质更易解决的问题,但目前并没有得到从厂商到平台端的大力开发。

UGC 不见踪影 PUGC 占比也不高

另一方面,不论哪种创作者,输出的播客都以长篇内容为绝对重心。短视频多半在一分钟以内,而根据「枫言枫语」收集小宇宙与 Apple Podcast 头部数千档播客数据制作的中文播客榜,订阅量前一千的中文播客单集时长的中位数达到了惊人的 48 分钟。这样的时长放进视频赛道里,甚至比 Netflix 的常规剧集的 45 分钟更长,用如此长度的内容吸引用户,往往需要产业级别的工艺扶持才能做到。

既然需要继续拓展市场,目前由 PGC 撑起的播客受众又数量太少,这就势必要求平台方接纳更多的 PUGC、UGC 创作者。

这里我简单地列出了从 UGC 到 PGC,对于主播与用户的优势劣势。重点在于降低双方门槛,把听播客和做播客都变成更轻松的事情。

有一个特点我们可以看到,由于当下头部播客的媒体属性,很多节目的话题常常会追随热点,但又因为长音频节目制作困难、中文环境里人才稀缺,所以更新往往较慢,又追不上热点。这就导致中文播客既喜欢讲热点又经常比别的媒介慢上几拍。这也是由于成本过高而导致的。如果缩短音频时长,就会有更多的节目能做到日更。

内容:什么是短播客

最后我们来定义一下,短播客是什么,短播客应该做什么样的内容。

短播客是什么?顾名思义的话,短播客当然就是更短的播客。

然而这样讲并不明确。中文播客的一大独特之处,就在于没有人真的搞清楚中文播客到底是什么。十八年的发展过去,时至今日,人们还是在不断发问:播客是什么?

层出不穷的问题:播客是什么

这是一件奇怪的事情,我们不断地在采访报道中看到类似的问题。最近风靡朋友圈的 GQ 的《播客人》推文里,又在文末问出了那个中文播客界长久以来的天问:郭德纲是播客吗?

似乎每年都有人问:郭德纲是播客吗?

显然,互联网五环内的人们已经有很长时间没有问过短视频是什么、Vlog 是什么,甚至在还没搞懂元宇宙、Web3 这些玩意的具体情况下也要装作胸有成竹的样子,可是讨论播客是什么,似乎还是一个比较时髦且专业的话题。

现在进行时的过时讨论

包括播客圈讨论的话题,近期流行的如高光混剪、品牌播客等,其实也是视频生态里许多年前的话题,似曾相识的讨论过后,得到的会是似曾相识的答案。

播客圈的流行话题 放在视频行业就有些古早味儿

而像「公布热搜算法」这样一个在任何其他内容平台都会被视为儿戏的要求,在播客圈能被热热闹闹地激情辩论,本身也说明了一些问题。

关于软件的鄙视链

圈子小但是爱吵架,明面上的友好之下也存在着鄙视链。我总结了一个播客收听工具的九宫格。

从守序善良到混乱邪恶

一个用爱发电的内容创作,如果没有明码标价的收益对比,那在圈子里满足人性的基础胜负欲的可能就是品味、喜好一类的东西。这些东西往往又很容易吵架。像看理想上的音频节目,除了少数开放 RSS 订阅以外的,严格来说都只能算知识付费。但由于节目制作精良,并且播客人对锵锵三人行和梁文道有多年积累的情节,所以我们还是会很通融地把它放进播客的大类别里;另外一边,作为音频行业领头羊的、拥有很多有声书、广播剧等内容的喜马拉雅,却容易被开除出播客行业。

从格调最高、守序善良的 RSS,到混乱邪恶的视频平台的「听视频」功能,这张表还呈现一类特点,就是越接近混乱和邪恶,越容易挣到钱。换个角度想,似乎 RSS 才是混乱邪恶。

方法,不是目的

在我们谈及播客定义时总爱用到的众多词汇里,似乎一切都是围绕音频而出现。我发觉这一类定义似乎偏离了播客创作者的初衷。在争吵定义的过程里,我们很容易忘记,这些词汇乃至音频本身,全部都是方法,不是目的。

我们更容易忘记的是,播客从来都不是纯音频。一直以来,播客都有 shownotes、单集封面,支持图片、外链等多种内容形式。我们强调播客解放双手、解放眼睛,却选择性地忘记所有的交互逻辑都基于双手和眼睛。

最近很多播客联合做的东北游系列,我觉得是一个绝佳的证明。这个系列十来分钟一集,短,且突破音频的承载能力。在博物志发送的这期节目里,婉莹就在 shownotes 里放置了大量图片来辅助音频。的确,图片能表述的一眼看完的内容没有必要用几十秒的语音重复描述。

当然,听众也可以选择不看。但必须要说明的是,不论是使用有线耳机、蓝牙耳机还是蓝牙音箱,收听播客的绝大多数场景里,手机都不能远离听众,看一眼 shownotes 只是举手之劳。

当时长缩短,为了继续满足信息量,就要突破音频的迷信和界限,这是短播客必须要做到的。

换句话说,给受众听和看的选择权。

短播客,富媒介

所以我将短播客定义为「富媒介」。是以音频为主去推动叙事,同时又包含了图片、视频、外链等综合性内容的媒介。

做一个类比的话,从播客到短播客,就应该像是从报纸到公众号。播客原本就有单集封面、shownotes,但作用不大;报纸也可以在文章旁刊载图片,但关联性不好,人们依然以纯粹的文字阅读为主,就像播客以音频为主;但在公众号里,每一段落的文字都可以有对应的图片、外链、视频,充分拓展了内容的丰富程度。

想象一个美食博主需要进行菜谱的教学,一个教程向的内容,目前只有两种载体:图文或视频。前者是拍一些图片,进行文字介绍,排版后发出。后者是用三脚架固定好机位,将做饭的过程录制下,再通过剪辑、配音等后期流程完成制作。二者都有自己的门槛,需要文字功底或视频制作功底,很难做到日更。

过分强调音频属性限制了播客内容的可能性

播客更是无法承载这样的内容,再长的音频也难以教会别人做菜。

但是短播客可以。

我们再来看一下这两张界面,左侧是播客中一直流传下来的功能性界面,视觉主体是一张主播们也不清楚到底应该放什么的单集封面,下方是播放条、速度调节等功能按钮;右侧是内容界面,放置的是 shownotes、评论区、节目发布时间等具体信息。短播客要做到的,就是把这两张界面融为一张。

合二为一

我做了一个简单的示意。视觉的主要区域承载过去 shownotes 的功用,可以与音频条联动,在用户翻到某张图片时,可以选择直接收听该图片关联的音频位置。这个图片位置也可以放置文本、视频或外链。上滑下滑可以切换播客,就像切换短视频那样。还有很多想象空间。比如滑着滑着可能会出现正在音频连线的直播,你可以先旁听一会儿后再选择是否进入,就像是偷听路人谈话。

最重要的还是降低了创作者和用户双方的成本。前面提到的美食博主教程,在短播客这一媒介上就可以用很低的成本完成。做饭时在关键节点拍照,做完饭、洗刷完后坐下来,根据刚刚的照片排序用语音复述整个过程,再为音频段落与图片或视频之间划上联系。文字和视频创作需要较高的门槛,但短播客所需要的音频表达能力是很多人在生活中磨练过、已经具备的。

用户也可以在漫长的教学中更快捷地找到自己想要获取的信息,略过很多视频教学开头的背景介绍、口播等冗余信息。PUGC 视频目前在推广的进度条章节功能也是基于这一目的,而播客长久以来一直存在的 shownotes 和时间戳使同样的创作成本在音频领域更容易被人接受。

和短视频错位竞争

说了这么多,核心的观点在于,中文播客对于市场前景和发展可能性的参照物一直是美国的播客市场,但考虑到本地执行时的区别,同样是学习美国市场,2012 年前后那一波中文播客平台已经尝试过一次,如果方法论不做改变,新的一波潮流过后结果可能非常相似。对于中文内容市场来说,参考已有显著成果、商业化逻辑成立、上下游的创作和用户习惯已培养成功的视频行业,也许是一个更好的选择。

影视飓风的 HKR 法则

影视飓风总结过一个关于视频质量的判断模型,由幸福感 Happiness、知识性 Knowledge、共情能力 Resonance 三大部分构成,简称「HKR 法则」。这个模型其实很接近学术上的「用户感知模型」,一个上世纪八十年代以来用于研究消费行为科学的模型,最早是被拿来观测超市购物的。模型中提到的维度即是情感价值、功能价值和社会价值。

用户价值感知模型

而不论哪种模型,B 站的知识区、小红书的笔记以及抖音上无数的教程,都更多地满足知识性、功能价值。它们往往不要求煽情的背景音乐、不断变化的转场、调色优美的照片,而更重视音频与文本所推动的逻辑和信息积累。这正是短播客所擅长的。视频其实更擅长共情、节奏,但因为强势媒介的地位,过去几年很多以音频与文字推动的知识类信息依然以视频的方式打包呈现。

总结:播客当回归媒介本质

当然,以上所有的观点都基于理想状态。产品形态、交互设计都只是展示思路。我更多想表达的还是,播客不是一个圈子,不是一种身份,不是一类观点相似的话题,不是一个有具体形象的媒体。播客应该回归到它的本质,作为一种媒介,去承载更多内容。

> 暑期征文 数字文具盒 火热征稿中,分享学习方法,拿走现金奖励 🧑‍🎓

> 实用、好用的 正版软件,少数派为你呈现 🚀