数据对我们的生活越来越重要,某种意义上它还扮演着生活与工作指导者的角色:我们如何选择食物,线路,品牌,策略甚至是生活方式。然而,对于数据,在这个日益将其神化的时代,我依然存在着许多迷思与怀疑。

当数据变成新的宗教

畅销书《人类简史》的作者尤瓦尔·赫拉利(Yuval Harari)在早些年猎豹移动 Connect 大会中提到「在人文主义时代当中,你有问题的时候,就要倾听自己的感觉,自己的内心。而现在有了数据的宗教主义,你的感觉都成了过时的数据,因为它们是7万年前在大草原上产生的算法。别听你的算法,听微软、谷歌、苹果的,他们了解你的程度远远超过你自己了解你的程度」。

无论你是否认同这个观点,不可否认的是数据已然成为我们生活中必不可少的存在。在不少人的眼里,数据已然成为了新的宗教,将它作为唯一的评判标准。

数据驱动可能存在的缺憾

1.所有的东西都是可量化的吗?

 

早年 NBA 官方为了评判一个球员的表现,引入了球员的基础数据,譬如球员的得分,助攻,篮板,盖帽,抢断,失误等等。然而依然存在着基础数据很难覆盖的情况,举个稍微夸张的例子,一名球员用他的身高臂长干扰了对手的投篮(并没有造成封盖),使得对手很难得分,然而这样的行为并没有转化成基础数据。于是现在的 NBA 由引入了各项高阶数据:正负值(一名球员在场上的时间里球队整体比分输赢情况),效率值(PER),进攻效率(ORtg),防守效率(DRtg)以及胜利贡献值(WS)等等。不过即便如此,在篮球领域,关于高阶数据模型的应用和置信度依然是个存在争议的话题。不少球员和教练认为比起数据他们更相信自己的眼睛和感受,他们明白哪些家伙更加难以阻挡,即便从数据上看他们并不是最高的那个。

从前在互联网公司工作的时候,我一直是一个数据主义者:在工作中,能让两个教育背景,价值理念等都不一样的人达成共识最好的办法就是数据了(当我们无法达成一致时,不如做个 AB 实验好了,看看结果如何?)。然而这样的解决方式实际上是怠惰的做法,它规避了人本身的情绪。仅靠数据达成的共识无法激起源自于内在的激情,也就是我们能达成一致的是共识而非热情,而创造力则源自于热情中。所以我们应当警惕,并非所有的东西都是可数据化的,至少现在,而那些未能数据化的部分,却又是如此重要。


2.应用数据的迷思

 

Jeff Bezos 在他作为 Amazon CEO 的最后一封致股东的信中这样写道

 We all know that distinctiveness – originality – is valuable. We are all taught to “be yourself.” What I’m really asking you to do is to embrace and be realistic about how much energy it takes to maintain that distinctiveness. The world wants you to be typical – in a thousand ways, it pulls at you. Don’t let it happen.

You have to pay a price for your distinctiveness, and it’s worth it. The fairy tale version of “be yourself” is that all the pain stops as soon as you allow your distinctiveness to shine. That version is misleading. Being yourself is worth it, but don’t expect it to be easy or free. You’ll have to put energy into it continuously.

我们都知道独特的创意是有价值的。我们都被教导要做你自己。我真正要求你们做的是接受并现实地看待保持这种独特性需要多少精力。这个世界想让你以上千种方式成为一个典型的人,它在吸引你。不要让它发生。

 

你必须为自己的与众不同付出代价,这是值得的。做自己的童话版本是:一旦你让自己的与众不同之处绽放,所有的痛苦就会停止。这个版本是有误导性的。做自己是值得的,但不要期望它是容易或免费的。你必须不断地投入精力。

那么数据在这个过程里扮演着什么样的角色呢?我们应该利用它还是警惕它呢?这是一个非常有趣的问题,因为通过大众点评,高德地图甚至是网易云音乐所给予你的,不过是那些高分/推荐内容,它的背后实际上是通过数据将人引导向一个个你可能喜欢的相似的集合中去。

是的,数据从来都是中立的,它不发一语地存在着,但显然应用者不是。 Platform Thinking+ 张宁分享了 Facebook 全球事务副总裁 Nick Clegg 的操作方法:

个性化是互联网过去二十年发展的核心。从谷歌搜索,到亚马逊购物,到在 Netflix 上看电影,互联网的一个关键功能是,它允许一个丰富的反馈循环,其中我们的喜好和行为塑造了提供给我们的服务。这意味着您获得最相关的信息,因此获得最有意义的体验。试想一下,如果 Netflix 没有根据你看过的东西提出建议,而是按照观看人数最多的电影和节目的顺序列出了数千部电影和节目。你会从哪里开始?

Photo by Thibault Penin on Unsplash

那么,这样的个性化是好的么?又或者说,无论是「看过这个的用户也看过」还是「和这个相似的还有」本质上并非个性的而是在进行归类,通过海量的数据将某个个体下一步可能的行为进行归类。这样是好的吗?

面对复杂的问题, Clegg 的回答是「这些都是深刻的问题,不应该留给科技公司自己回答」。

是的,该将个人引导向何方从来就是一个深刻而沉重的问题,科技公司即便有着海量的数据,也无法给出一个完美的答案。模糊的态度和无法给出的答案并不意味着答案不重要。正如贝佐斯所分享的,在成为自己的过程里,需要付出代价。而警惕数据和它会造成的后果,是我们需要重视的。播客《声东击西》# 153 期:算法这只温柔的野兽里也分享了一些信息与数据给人们造成的不同状态:过滤泡,信息茧房与回音室。


3.操纵数据的那双手

 

数据是始终中立客观的,这一点毫无疑问。然而当有某个人将某些数据呈现在大家眼前时,它已然带上了价值,我们需要对此思考的几个问题是:

·要解决的问题和数据是否是强相关的?
·这是全部的数据了吗?
·为什么是 A 数据而非 B 数据?
·A 数据是反映问题最直接和恰当的数据吗?

每当到季度末或者出财报时,我们总能看到不少的增长与利好消息。「只要在增长那么一切问题都不是问题」的理念掩盖了诸多潜在的危机,甚至增长本身也是值得商榷的:在许多时候分析数据时,通过拆解时间区间,比较同比环比甚至变更比较的口径,你总能得到一个在增长的数据,而那数据也肯定是真实存在的。

播客《迟早更新》里 Episode 158:是不是赞美冬天就能唤醒春天中任宁提到「在无知之幕里为了确保公平我们需要想象自己毫无立场,但我想实际没有人能做到这一点,而为了确保客观,现代社会的我们把没有主观意识不会说谎的数据作为观察世界的一个代理。而且我们理所当然地认为,使用不会说谎的数据去推导出来的结论,哪怕是由会说谎的人去推导出来的,那它也能代表真实」。我们需要明白的是,当数据出现在眼前的那一刻,它已然代表了某种立场与价值,先明白那是什么,再认真去看后续的数据。

Photo by Jeswin Thomas on Unsplash

对于操纵数据的那双手来说,它也可能有着一些错误的方向,《OKR 工作法》一书中提出了使用 OKR 工作法的方法和好处:

OKR起源于英特尔公司,后来谷歌、Zynga、领英、GeneralAssembly(硅谷知名的创业教育公司)等公司使用后,都实现了持续高速的增长。在这里,O表示目标(Objective),KR表示关键结果(KeyResults)。目标就是你想做什么事情(比如,上线一款游戏),关键结果就是如何确认你做到了这件事(比如,一天2.5万下载量或一天5万美元收入)。按照年度、季度设置OKR都可以,但一定要关联上公司的愿景使命。有挑战的目标能激发团队的斗志,明确的关键结果又会让大家觉得这不是空谈。如果你发现一起床就有做事的激情,说明你设置了一个好的目标;如果你看到关键结果时有点担心,那这个关键结果的设置就是恰当的。

书中列出了茶叶销售团队所设立的 OKR ,目标:向餐厅供应商证明我们所提供的优质茶叶的价值。关键结果1:客户重复订购率达到 70%。 关键结果2:50% 的重复订购客户能自助完成重复订购。关键结果3: 完成 25万美元的销售额。这显然是明确而高效的讨论,通过设立目标与连接关键结果的方式,让团队成员们能更好地明晰数据与未来方向之间的关系,他们也都将参与进来。然而并非所有的目标都能得到完美匹配的关键结果。譬如如果一个互联网社区的组织者的目标是建立一个「氛围良好活跃的高质量互联网社区」,那么关键指标该如何定义呢:举报率降低到某个百分点?每日发布人数/每日使用社区的人数?内容被点赞的比例?然而很少有人举报内容就意味着社区氛围良好吗?又或者发布内容的被点赞数高就意味着高质量吗?当面对过于复杂的问题目标时,我们未必能设置足够匹配的数据目标,尽管他依然还是会继续做下去。当这个问题投射到个人身上时会变得更加复杂,它涉及到了个人的价值判断,大部分的「我要成为什么样的人或者过上什么样的生活与怎样的人相处」时如果仅依靠数据来描述,会和脑海里真实想象的部分存在着差异。​​​​​​

我们仍将继续与数据共存

 

以上是有关数据的一些迷思,它并不代表着全盘否定数据,推崇去过刀耕火种,小而美的生活。相反它更多是疑惑和想法,在我们未来仍将继续并且更多地和数据相处时提出一些需要警惕与思考的地方。

最近知乎上讨论关于副处长体验送外卖的问题,美团公司代表提出针对外卖员自己并不提供劳动工具。知友王子君认为「数据是生产资料、以一定有序状态使用数据指导交易的互联网平台自然也是生产工具,我个人觉得这个概念是可以接受的」。我完全认同这个看法,外卖 App 将个人外卖员 A (而非外卖员 B)与用户 C 连接起来,并给出建议路线以及要求时间等等,这些数据本身就是生产工具的一种,在外卖员这个行业里,我们已经让数据如此深入地参与了我们的生活,那么如何更正确地审视和评判数据,将它设置在生活中的哪个位置是我们接下来需要花费时间和精力去练习的。

 

题图:Photo by NASA on Unsplash