AI叫嚣了这么些年,好像除了在图像识别领域应用大放异彩,NLP方面似乎一直停留在论文期刊上争奇斗艳。


印象中开始为大众熟知的最早的语音智能助理是apple 2011年推出的Siri,随后各大手机厂商发力追逐,形成今天基本上所有手机厂商都有一个智能助理的局面。说实在的,如果这个智能助理真的能伴随自己成长,不出岔子,谁有忍心后面中途把自己的孩子换掉呢?


然后似乎人工频频挤上头条,智能却往往被爱称为“智障”,让大家从熟悉的GUI切换为VUI,成本可不是一般的低。我简单的想了下VUI的尴尬之处:公共场所暴露隐私和对身边人的骚扰;语音指令的模糊性(交互边界的不确定性);信息传递时延;多人,环境条件较为恶劣时的干扰;智能程度等。这基本上都成为阻止他在日常生活在广泛应用的绊脚石,然而,GUI和VUI之间并不是天然的对比和取代的关系,友好合作才是让生活更美好的最佳解决方案。


最近手机厂商纷纷新出了一个小玩意——AI语音电话助理,小米的指尖通话,vivo的电话秘书,其实鼻祖是Google一年前发布的call screen 。

一年后,国产厂商发力,终于迎头“赶上”做出一个中文版本的AI语音电话助理。而且似乎也比较智能。

小米的指尖通话相对于Call Screen,从智能对话上已经能够完全碾压(毕竟过了一年了),交互也足够简单。


vivo 的电话秘书相对小米走的另外一条路子,直接机器人帮你对话。

我和朋友看过后,纷纷表示:嗯,好像很厉害的样子 。但是电话如此少的现在,真的需要这样一个电话助理吗?


在手机用户数不断增加,通话数量不断下降的现在,这个玩意还有意义吗?iOS用户表示,防骚扰方面还真的挺有意义,起码陌生电话让AI先接一下,这样就不用担心房产、荐股、理财、保险的轰炸了。那么问题来了,这么精妙的想法,请问如何在iOS上使用“指尖通话”或者“电话秘书”呢?逻辑形成完美闭环,堪称死结典范。

幸运的是,APP厂商走的比手机厂商远得多,当指尖还在内测时,当在5000元在钱包口不愿离家时,一众APP厂商提供了更加可行的替代方案——APP电话助理。



(从做到右依次为:阿里二哈,小象来电助理、豹小秘)

目前市面APP上的都可以实现智能对话,但是暂时还没有一个能做到指尖通话(吊诡的是,小象做了一个半成品的指尖通话,只能看,但不能控制机器人说,不知道是基于什么考虑)。


二哈虽然出现最早,但是对话效果确实不敢恭维;小象来电UI太过于朴素,不过胜在走的最远;豹小秘界面最简洁,亏就亏在订阅付费。总体来说,各种电话助理千奇百怪,但是底层逻辑都相差不大,利用运营商的呼叫转移功能,将电话转到APP厂商的线路上,在云端实现对话交互。如果要我推荐的话,都可以试试,爱玩的童鞋可以试试小象的声音克隆功能,虽然克隆时间有点漫长,这一点可以看出和大厂百度的差距。


那么最后,到底需不需要这样一个助理呢?


如果作为一个骚扰电话比较少的人,像我,还有必要安装这样一个软件吗?我觉得未必,从对话的体验上来说,如果是比较简单的生活化场景,APP都能hold住,但是人说一些稍微复杂的内容时,机器人还是力有不逮,反倒是一些推销的机器人貌似做的好一些。和一个做相关工作的朋友聊了下,大概原因是推销是有一个很明确的场景,但是接电话更类似闲聊,需要强大的知识图谱,也许和replica之类的闲聊机器人结合是个不错的思路。


但是,作为一个资深的电话恐惧症患者,这类APP还是有其存在的价值。起码在赤裸裸暴露在对方未知的情绪面前,机器人可以帮忙先主动要个预防针。同样的,在注意力抢夺时代,有这样一个“智障”帮忙挡住一部分信息,也许让你能够在安静的午后认真发个呆吧。