Google Home 是 Google 在今年的 I/O 开发者大会上推出的最新硬件设备,然而,如果你没有收看大会的直播,现在访问 Google Home 的官网,会发现除了几张设备的实景图片之外,没有任何多余的介绍。

简单来说,第一眼看去,Google Home 就像一台无线蓝牙音箱,但它显然不仅仅只是一个音箱那么简单。事实上,它可以像人一样与你交谈,听懂你的命令,你可以认为它是 Google Now 或者说 Siri 从你的手机中脱离成了一个实体硬件,摆放在家里,可以随时随地与你对话,你只需要喊它一声「Hey Google」或者「OK Google」。

这么说,你可能还是没有直观的感受,那么一起来看一段视频吧,胜过千言万语。

【跳转播放视频】

你可能会奇怪,我是不是放错视频了,当视频最初出现亚马逊包裹的时候,你可能还以为是要拆箱 Google Home,直到你发现整个视频都在讲一款叫做 Amazon Echo 的设备。

那么,再看看这段在今年 Google I/O 大会上的 Google Home 登场视频,两者是不是惊人的相似?设定的场景,都是一家人在家中,如何通过语音与设备互动。Amazon Echo 和 Google Home 的功能也十分类似,播放音乐、设定提醒、查询信息等等。

【跳转播放视频】

事实上,Google Home 在发布时就毫不忌讳地表明了,它就是和 Amazon Echo 直接竞争的。Google Home 虽然尚未正式发售,但是 Amazon Echo 已经发售将近一年(2014 年发布,2015 年正式发售)并获得了大量好评,因此想了解 Google Home 的未来,不如先看看 Amazon Echo 的现在。

让我们从 Amazon Echo 说起

国内对于 Amazon Echo 可能了解得还不多,实际上这款于亚马逊发布于 2014 年的硬件设备,近段时间在国外的科技圈非常火。亚马逊甚至专门为这款设备购买了超级碗期间的黄金广告,这也是继 Kindle 以来,亚马逊另一款大获成功的硬件设备。

几乎主流的科技媒体,都有在谈论 Amazon Echo,或者如果你经常收听国外的科技播客,那么一定会听到 Alexa 这个名字,不要奇怪,它就是 Amazon Echo 可以设置的一个唤起别称。

不过,说 Amazon Echo 只在科技圈内火爆也是不准确的,仿佛这只是一个小众极客的玩物。事实上,从销量来看,根据第三方调查统计,亚马逊已经卖出了 300 万台 Echo 设备,其中有 100 万台是去年年末的节日季卖出的,在黑色星期五,它夺下了 100 美元以上电子产品的销售冠军。而在 Amazon 官网上我们也可以从 36000 条的客户评论中看到 Echo 为用户在日常生活中带来的各种便利。

你可能会好奇,Echo 已经能做到什么了呢?播放音乐、创建提醒自然不在话下,它还能根据你在亚马逊上的购物记录,智能地帮你下单。甚至,已经有人用 Echo 控制了家中几乎所有的设备:调节灯光和温度,控制电视机、Apple TV、安保监控、热水壶,开关车库的门,冲马桶,了解汽车里还剩多少油……这意味着,在家中不需要遥控器,不需要额外的按钮,你只需要像说话一样表达你的诉求,是不是像极了科幻片中的场景?

事实上,哪怕此时此刻,Amazon Echo 仍在不断进化中,这主要得益于 Amazon Echo 的 Skills。简单来理解,Skills 之于 Amazon Echo,就如同 App Store 之于 iOS 生态。通过 Skills 开发组件,第三方开发者可以个性化地为 Echo 定制一系列功能,让它听懂更多事件,解决更多的问题,例如陪你健身、控制任意的家电等等。许多人诟病 Siri 之类的语音助手服务,无法向第三方开发个性化的定制接口,而 Echo 的 Skills,目前已经有 500 多个 Skills,意味着 Echo 能做的事情,已经远远超出了其同类的 Siri 和 Google Now。

可想而知,虽然 Google Home 还没有正式公布售价和上市时间,但媒体们都已经在纷纷议论:作为 Amazon Echo 正式发售两年后推出的 Google Home,其优势和差异化又在哪里?能真的做到青出于蓝胜于蓝吗?

Google Home 和 Amazon Echo 的各有所长

Google Home 最直观的差异,肯定就是外观上。Amazon Echo 作为亚马逊出品的硬件设备,一如继往地继承了其黑大直的形象特征,Amazon Echo 在体积上比 Google Home 大多了,当它在听你说话或者回复你时,顶部会有蓝灯闪烁。

而 Google Home 在设计上不仅小巧的多,曲线的一些切面也让整体显得更加可爱和圆润,不像 Echo 那么冷冰冰,立面上的灯也使用了 Google 经典的四色系。另外,Home 提供了不同的底座颜色选择,单从设计这一点来看,Google 之于 Amazon,简直就是 Apple 之于 Google。

如果说外观和设计还是仁者见仁的事情,那么其核心功能就是硬碰硬的对比了。尽管 Google Home 还没有正式发售,但从已知的信息来看,两者主要的差异体现在以下几方面。

1. 语音理解能力

毫无疑问,Google 在语音识别方面相比 Amazon 有着得天独厚的优势,在这一届的 Google I/O 上,Google 甚至展示了最新的 Google Assistant 已经拥有了理解前后文内容的能力。比如说,你告诉 Google 你想要找一部好看的电影,Google 贴心地为你推荐了一部 R 级限制影片,这时候你直接告诉 Google,你的小侄子要和你一起看,Google 就能自动理解你的小侄子是要和你一起看电影,会另外向你推荐一部适合你和你侄子一起看的电影。就这一点来说,Echo 肯定是完败。

2. 多语言支持

Amazon Echo 两年下来,仍然只支持英语,虽然 Google Home 的首发也仅局限在美国地区,但是从技术能力上来看,Google Home 想扩展到更多国家和语言,只是一个时间问题。甚至,就像苹果在发布 Apple TV 时那样,Google Now 和 Siri 都有了一定能力,能在一个句子中混搭理解两种语言,如听懂你说「能给我推荐一部 Jennifer Lawrence 的电影吗」这样的表达。和语音理解能力一样,这也是一个巨大的技术储备鸿沟,Echo 并不占优势。

3. 开放性与生态

前面提到了,Echo 拥有一套完整的 Skills 开发工具和生态,目前已经有 500 多个 Skills 扩展能力。而 Google Home 目前并没有提供一套面向第三方开发者的开放平台。不过,凭借 Google 的影响力,还是找来了一堆知名的第三方服务商接入 Google Home,至少在主流的能力上,Google Home 和 Amazon Echo 不相上下。但如果想要更高的可玩性和定制性,如用 Echo 来控制家中所有的设备和电器,Google Home 恐怕还不能胜任。相信 Google 为 Google Home 推出第三方开发平台,也只是时间问题,另外,Google Home 支持全套 Google 服务的无缝对接,如创建日历等等,这也是不小的优势。

4. 语音识别速度

Amazon Echo 一直引以为傲的是其语音响应速度。亚马逊花了整整三年的时间来攻克这个技术难题,让语音回复的等待时间,从最初的 9 秒缩短到 1.5 秒,按亚马逊的说法,这远远超过了同类竞品 3 秒的平均水平,而 Google Home 在这方面能力究竟如何,还有待正式发售后,实际体验了才知道。

科技巨头为什么对语音交互如此热衷

从 Siri 开始,语音助手已经成为了每一家科技公司的标配,在那之后,Google 有了 Google Now 和如今的 Google Assistant,微软有了自己的 Cortana。而这一轮的语音硬件产品,又开始了新一轮的竞赛,让人不禁怀疑,在 Amazon Echo 和 Google Home 之后,苹果和微软是否也会推出类似的家庭智能设备呢?

从产品形态上来说,Echo 和 Google Home 这类的设备更加纯粹。相比起 Siri,没有任何的屏幕文字反馈,你就像在和人交谈一样,你和她说话,她用声音回答你。整个流程,就是 Voice In Voice Out,这里面巨头在抢占的,不仅仅是你的客厅,更是各家人工智能的技术储备和较量,语音交互的探索和实践。

从语音交互的速度来看,世界上文字输入最快的世界纪录是 212 个单词/每分钟,而说话速度最快的纪录则是 637 个单词/每分钟。在普遍人每分钟文字和语音的输入效率上,这个 3 倍的比例依然成立。这还只是语音和文字输入的对比,想像一下语音替代更传统的遥控器和按钮,你再也不用找到遥控器,从上面那一排排密密麻麻的按钮中,找到静音在哪里了,只需要像讲话一样,告诉你的电视机别发出声音,想想两者之间交互的效率差异。

不仅是速度,交互边界也发生了外延。从前设备与设备之间是孤立的,随着物联网的大潮,未来每一个物件都会连接在一起,告别那些笨重而丑陋的遥控器和各类按钮,告别那一本本没人阅读的说明书,也告别你需要在手机上分别安装 5 个 App 去控制 5 个不同的家电。你只需要拥有一个 Echo 或者 Google Home 这样的中央设备,然后对它说话,一切便自然地发生。

不过,还是要强调一点:语音和之前的交互方式,并不是完全的替换关系,就像手机不能完全替代电脑一样,语音作为一种交互方式也并非是万能的。想像一下作为一名小说家,如果全程用语音输入来写作,仅靠口述和聆听,那一旦想修改编辑之前的段落,简直是反人类的体验。

除了家居领域之外,语音交互另一处可以大放异彩的领域,便是 VR。虽然 VR 本身还在兴起,但是想想目前已经有的应用场景,无论是游戏、教学,VR 都还只是视觉上的模拟,在触觉相对难以实现的前提下,想想你可以在 VR 里和环境发生对话,游戏的 NPC 不再只是头上顶着文字的 NPC,教堂课堂上,你不仅仅是看到 VR 里的历史人物,你还可以和他们对话VR 可以是视觉和听觉的双重虚拟,你可以用动作和声音与环境发生互动。

语音交互的背后:人工智能是未来

这一届的 Google I/O,也许从产品层面来看,并没有太多的亮点和惊喜,不过,Google 用这两年的时间,不断地强化着一条主线和立场:人工智能。从识别你的照片内容,到聊天智能提供选项,再到理解你说话的前后文,这些无不是人工智能的功劳。

甚至,语音交互本身,也是人工智能最重要的产物和成果。回想一下,每一次交互的变革,其实都需要大量的技术积累。以前的 GUI 界面,是图形技术、鼠标设备、彩色显示器等共同作用下的产物,而今天的语音交互,对容错率提出了更高的要求,如果你说一句话,Siri 或者 Google 或者 Echo 不能理解,所带给你的挫败感,远胜于点击屏幕上的一个按钮没有反应。真正好用的语音交互,如果没有今天的网络带宽,没有人工智能的算法,没有足够的样本库学习,根本不可能存在。

而现在所有的语音助手,不管是你手机上的 Siri,还是设备实体化的 Google Home,都还是被动地交谈,你必须给出命令,它们才会应答。但这肯定不是语音交互的最终形态,人工智能,一定可以带语音交互走得更远。想像一下 Google Assistant,深度学习和大数据已经做好了充足的准备,它们能预知你接下来要去哪,要见什么人,甚至在想什么,如果配合使用一些传感器,Google Home 或者 Echo 就能选择在合适的时机,用语音的方式输出这些信息。与其点亮手机去主动地查看,未来,随时随地,Google Home 或者 Echo 就像你在家中的秘书一般,与你主动交谈。

美剧《灵异之城》(Eureka)中有一座房子,这个房子本身是具备高度 AI 的,尽管你看不见她,但在任何房间里,你可以和她交谈,她可以帮你控制关于房子的一切,灯光、温度、微波炉、冰箱……她可以陪你聊天,她甚至能检测到你心情低落的时候,主动给你讲笑话。

在我们有生之年,这也许就将不再是科幻片中的场景了。