Google Assistant 作为目前公认最「聪明」的智能语音助手,在 5 月 9 日的 Google I/O 2019 上又得到了诸多提升和新能力:

  • 它的响应速度快到没有响应动画;
  • 智能的方式也不再局限于「语音」;
  • 甚至开始用大量的数据积累改善体验。

Google Assistant 的每项更新都展现了对于「智能助手该做什么」的思考。让我们一起回顾和分析 Google I/O 2019 上的 Google Assistant 吧:

Duplex on the web

相信大家都记得去年的 Google I/O 大会上 Google Duplex 的表现。它能自然且流畅地对话,甚至真人都无法察觉。去年带来的演示是 Duplex 替你拨打餐厅电话,和服务员沟通并预订座位。今年的 Duplex 不再局限在语音上面,而是帮你完成网络上较为复杂且机械性的操作,让我们来看一下现场的演示视频:

Duplex on the web 视频介绍

我们看到,只需要说「为我的下次行程租个车」,Duplex on the Web 就会自动打开租车网站,快速走完所有流程,等你按下最后的「确认」键。我第一次看到演示的时候,感觉既惊讶又熟悉,感叹它神奇的同时又觉得其原理在情理之中。于是我分析了一下 Duplex on the Web 租车的过程中到底做了什么。

Google Duplex 是如何租到车的?

如果我们一步一步看租车过程的演示,就能发现 Duplex on the Web 主要做了两件事:一是信息获取,二是自动填表(Auto-fill)。

首先,是信息获取。用户发出「在 National Car Rental 网站上为我的下次行程租个车」命令后,Duplex 需要知道「下次行程」的相关的信息,于是它从日历和邮件中获取了「下次行程」的日期和地点等信息。

获取行程信息

之所以要从日历和邮件中获取旅行信息,是因为宾馆和航班的确认信息都会发邮件给客户,邮件中又包含了日期和地点等必要信息。而日历则会包含用户主动创建或者被他人邀请的事件信息。所以这两个服务正是用户行程信息的「一手消息源」。

接下来,便是一系列的自动填表。自动打开租车网站,带着上一步拿到的信息,填写地点,日期,等等信息。

自动填表,等待确认,自动点击下一步

这种操作大家一定不陌生, 我们在网站上填写用户名密码甚至更复杂的表单时,浏览器会根据储存的信息自动帮我们写好,Duplex on the Web 也做了同样的事情,不同的是这个「表单」的信息需要有信息支撑

浏览器上的自动填表功能已经在帮我们填写表单

最后,对于是否需要婴儿座椅这种超纲问题,Duplex 交给了用户主动填写。按下确认,车就租好了。虽然不是完全自动的,但也给我们节省了绝大部分的手指关节运动。

这样看下来 Duplex on the Web 租车无非是一系列操作的自动化,iOS 的捷径已经在操作系统层面上做到了自动化,Bixby 甚至在第三方应用也实现了自动化,他们有什么不一样呢?

和「传统自动化」有什么不同?

我这里说的「传统自动化」,是指捷径,Bixby,Automator 以及 IFTTT 等等。Duplex on the web 的自动化和传统自动化最大的不同就是有信息支撑,这让自动化体验高出了一个等级。

各路来源的信息作为支撑

在租车这个案例中,如果 Duplex 不知道你什么时候出发,去哪里等等数据支撑,那就失去了意义。我们分析一下租车需要哪些信息:

  1. 行程信息(通过邮件或日历获取,比如日期和地点)
  2. 用户身份信息(获取用户填过的表单数据,比如联系方式和登录密码)
  3. 支付信息(获取用户保存过的支付方式信息,比如信用卡号和安全码)
  4. 车型喜好信息(获取类似情况的邮件,比如上次租车的确认邮件中的车型)

所以 Duplex on the Web 的实现远不是「技术」能解决的,它是更像是「信息的充分利用」。这也是为什么 Google 会去做这个事情,因为 Google 有 Gmail、Google Calendar、Google Maps、Chrome 等互联网基础服务。这些服务用户量庞大,经手的信息都非常重要,租一台合适的车是足够用了,而「传统自动化」获取这些信息相对困难。

另外,「传统自动化」通常需要用户去定义每一步的操作过程以及触发条件,甚至需要一些编程常识。而 Duplex on the web 用起来更加简单无脑,只需要下命令就好。但这个事儿不好说,它有可能是真的智能,也有可能是谷歌工程师帮你定义了每一步操作。

「智能助手」的新思路

读完这些,你可能会想「国内也用不了啊」。就算网络访问顺畅,国内的情况也确实非常不同,不说 Gmail 用户多少,我们是不习惯使用邮件发送确认信息的,更多是用短信,App 通知甚至微信的服务消息。所以 Duplex on the web 的启发意义要大于实际意义,毕竟国内也有类似谷歌这样的信息大头,比如阿里系和腾讯系,甚至 MIUI 之类的定制 Android 系统也有机会去做。

Duplex on the web 的「自动化」本质决定了它的使用场景,这也是为什么它会先对租车和订电影票这些场景下手,他们对人来说相对简单,操作相对机械化。不过不要小看这些场景,我们日常生活中的飞机票、火车票、电影票、水电费、电话费、房租等等可都是 Duplex on the web 发挥的时候。

目前 Duplex on the web 的上线日期还没有定数,官方给出的预期是「今年晚些时间会有更多细节」(预测很有可能是在下一代 Pixel 手机发布期间),我们可以期待支持更多的网站,甚至作为系统级应用,应付手机上所有的机械操作。