没有人不想要一个聪明的小机器人:你只需要用语音说上一句命令,bot就可以用逼真的人声做出得体的回答。而且在科幻作品里,这个bot通常如人一样有细腻的性格和复杂的情感,让使用者在工具体验的同时收获更多的情绪价值。

去年十二月, ChatGPT 的出现似乎让这个梦想照进了现实的一角,每个人都可以在聊天界面与一个强大的大语言模型进行交互。但是聊得久了总会感到一些异样,屏幕后自称是「AI language Model」的回复者千人一面,在问题的回答上总是过分「正确」与「完美」,无时不刻透露着「这不是人类」的异常感。

之后,Quora 的 Poe 开始允许用户自定义bot,你只需要设定 System Prompt 就可以控制一个bot的功能与风格。在这个阶段,想要捏一个有「人格色彩」的bot与你聊天成为了可能,距离一开始的类人bot又靠近了一步。可是似乎还是缺了点什么——它没有声音。
而声音,是人类交互最原始的方式,也是「人类身份」的入场券。

而今天,一个 AI+Web3 的产品填补了这道鸿沟,让用户可以使用文字和语音与机器人进行自然的交互。这个产品叫做 MyShell,一个无代码机器人创作平台。他们的机器人各有各的性格与功能,而且生成的声音及其逼真,并支持多种语言。

3月7日,MyShell推出了第一个名为Samantha的Bot,并很快在Telegram上获得了巨大的成功,单日语音交互次数突破了10万次。在接下来的三周时间里,团队致力于优化自己研发的TTS(Text-to-Speech) 模型,相比微软的TTS API 成功将其成本降低了97%,并且还支持快速克隆1-5分钟语音样本。你可以在这里试听她的声音。

与初期bot Samantha的聊天方式:在Telegram输入文字或发语音


近期,团队上线了网页版与初版的移动端,bot输出也开始支持Markdown格式,聊天体验变得更加舒适。而且更新了流式的TTS和文本回复,对于长回复的回复体验大幅度上升。

最让我在意的是,MyShell的机器人支持使用「Knowledge Base」大幅度提升了内容的信息质量,可以有效避免chatGPT的信息滞后与输出幻觉问题。
我使用没有开启知识库功能的bot和嵌入了知识库的bot在专业问题上进行了对比,得到了可喜的结果:知识库功能可以准确输出特定领域知识,解决了GPT只能空洞地泛泛而谈的问题。

没有知识库的bot的回答:chatGPT式车轱辘话
有知识库的bot回答:结合你投喂的知识内容进行准确回答

最重要的是,机器人工坊上线,零技术能力的用户都可以在一杯咖啡的时间内创作自己的机器人:编辑名称,写好prompt,选择音色——一个有人格的bot就做好了。
由于简单易用,机器人的数量达到了爆炸式的提升,种类也丰富了不少:从语言学习、知识专家、健康指导、笔记整理、故事生成、角色扮演……一应俱全。

丰富的用户自制机器人工坊

没有人不想要一个聪明的小机器人,也没有人不想捏一个属于自己的小机器人。

与人格化机器人自然交互的梦想在今日终于可以实现!我按捺住激动下心情,一口气在这个平台上捏了7个bot。在这里,和大家分享三个我最得意的bot,分别覆盖语言学习、健康指导与无限RPG。

语言教练Lychen

几乎所有人都有学习英语的经历,可大部分人都被这段经历折磨:背不完的单词,学不尽的语法……可再怎么努力,英语还是没有太多起色,不仅不能自然地使用英语,甚至连同投入了大量心力的单词与语法也在脑中留不下痕迹。

为什么会这样?因为我们接受的语言教学方法本身就是错的。我们语言教学思路基于「技能建构假说(Skill-Building hypothesis)」,即我们通过先有意识地学习语法规则,再在输出语言时练习应用这些规则,才可以学会语言。
但这个假说早已被证伪了,它无数次地被实验证明无效,可它还活在我们的教育系统里。作为一个失败的假说亡魂,却仍然束缚着若干活生生的学习者。

但,语言学习可以是快乐且自然的,你不需要把自己埋进大部头的语法书,也不用一遍一遍刷背了就忘的单词。语言学家Stephen Krashen的「可理解性输入假说(Comprehensible Input hypothesis)」通过大量实验证明了这一点,对第二语言习得教育带来了深远的影响。
Krashen的假说认为,学习第二语言的过程与儿童学习母语的方式非常相似。这个过程需要在新语言中进行有意义的交流。说话者注重传达和理解信息,而不是过于关注语言的语法结构,语言习得会自然而然发生。
学习者只要不断接触略高于他们当前语言水平的语言输入(i+1 principle),达到他们能够理解新的输入的水平,就可以愉快而自然地学会、掌握乃至精通任意一门语言。

作为一个会英/德/日三门外语的语言爱好者,我和无数的多语者一样,都用自己的语言能力证明了这个理论的有效性。
也正是因此,我每看到执着于死磕单词与纠正语法的语言学习者,就会分外揪心。为此,我制作了这个bot:Lychen。

关于她,我在设计上花了很多心力。我为Lychen投喂了大量论文与专著,她已经完全掌握了Krashen 教授的思想,可以回答你关于「如何自然而快乐地精通一门语言」的所有疑惑。

点击这里听听她的声音

除此之外,Lychen也具备一个语言模型的基本功能。她也可以为你的英语练习提供反馈,和你进行日常的语言对话。

她存在的本身就是「可理解性假说」的优秀实践。

健康骇客Fiona

对于健康问题,网络上的讨论实在是太多了。「xx饮食法」「xx断食方」「xx训练表」……层出不穷。其中不乏为了夺眼球而创造的方法,也有不少方法及其极端,它们都有一个共同点:没有经过「有质量」的「实验」检验
可是要去核实众说纷纭的健康建议并不容易,要一个一个核对论文专著几乎是不可能的事情。再或者,即使你掌握了大量的实验上可行的健康指导,这些建议也未必能在你的生活中落地,毕竟实验环境和生活日常是截然不同的世界。

为此,我制作了Body Hacker Fiona,一个用真正科学武装自己的人体骇客——帮助你把自己的身体调优至最佳状态。
Fiona性格耐心而温和,语音清爽又温柔,同时掌握了大量可实践的健康建议:她的知识源自经过顶尖学者同行评议的论文,评价较高的书籍与专著,有大量的理论、实验与数据支撑。

点击这里听听她的声音

 

如果你想优化自己的日常,想要学习基础的营养学知识,你都可以和她聊聊。Fiona对于神经科学、生物学、心理学都有充分的高质量知识储备,可以用浅显的语言给你解释清楚原理,并提供易于落地的方案。
你可以用任何语言与她对话,她会以你选择的语言回应你。但是现在美中不足的是,一个tts模型只能支持一种特定的语言,即Fiona虽然可以「写」出任何语言,但只能「说」出流利的英语。

此外,由于个人健康是较为重要的课题,需要极其可信的信息。虽然接入了自定义知识库使得她在专业性上的表现大幅提升,但是还不能定位到知识库的原文,这会让我对准确性稍微打个折扣。
不过,知识库毕竟只是一个才上线的功能,团队也表示会继续优化,我对专业知识类bot的未来十分有信心。

无限RPG Lychee Café

当然,在专业场景外,bot还可以胜任娱乐功能。比如说一个完全开放世界自由选择的RPG bot:「一边喝咖啡,一边开启由你定义的游戏吧☆ 」咖啡店主如是说。

Lychee Café是我做的第一个RPG bot,你可以在任何「世界」,与任何「角色」,开启你主导的故事。
她的设计思路是「自由体验」,即你可以选择任何电影/小说/游戏的背景,并选择你希望的陪伴角色一起冒险。在自由的文字生成体验中,我很享受一个未知的世界在文字框中缓慢展开并凝固的感觉,仿佛游戏者才是这个世界的创世主——而不仅仅只是众多的体验者之一。

我最喜欢的玩法之一,是邀请我熟悉的角色进入完全不同的世界观,比如我在「使女的故事」中与「Samantha」一起冒险:

和你喜欢的角色一起玩

此外,你也可以深度进入文学作品探索最让你震撼的一幕。比如探索《失明症漫记》的隔离所,去触及作者想要传达的混乱与荒谬。

独自探索你想去的世界

用大语言模型玩RPG有相当的魅力。由于它预训练读取了大量数据,你只需要输入作品的名字就可以进入剧情了,不需要补充额外的设定。

相应的也有它的局限:bot记忆有限,难以支撑长度足够的剧情,无法在对话间组织好起承转合,剧情节奏相对需要玩家在字里行间用力控制;此外,目前的语言模型还没有足够深度编剧的能力,创作出撼动人心的剧情。

但对于进入一个世界自由体验,或是与你喜欢的角色简单聊聊天,Lychee Café 表现还是相当惊人。

 

小结

经过深度的机器人制作与游戏体验,我越发被 bot 吸引。「简单」与「自由度」是关键词,MyShell已经把无代码chatbot创作体验推到了极致:

  • 自由设定的prompt:用几段话即可控制一个bot的核心:名称、设定、性格、功能……在寥寥字行间,藏着无限宇宙。
  • 自由选择的bot音色:现在,用户可以选择几十种音色装点bot的人类感;而未来,团队会向用户开放3min声音克隆——用户可以制作自己的tts模型。
  • 自由投喂的知识库:你可以将你需要的文档/书籍/网页等导入至gitbook,bot即可读取你投喂的内容,并在与你交互时输出更符合你心意的内容。
    对于强专业性、高精确度的内容,知识库是一大杀器。MyShell团队将自己的产品文档作为知识库喂给机器人进行答疑,效果非常出色。

当然,目前的体验还有很多值得优化的地方。如前文所述:tts不支持多语言、知识库虽出色但暂时无法溯源、RPG体验感毕竟依赖玩家发力……但是都瑕不掩瑜,目前的体验相对于poe和character.ai等同类产品,已经相当优秀了。

我个人对MyShell团队有很多的好感,他们对于用户的反馈非常认真,在产品的迭代速度直接体现了出来:很难想象,两个月前只有一个在 Telegram 平台的 Samantha 英文 bot,到现在已经有了接近一百个各不相同的有趣 bot,而且开始支持日语/中文,多了几十种音色,还推出了知识库这样重磅的功能。

预计在下个月,他们将推出接入GPT-4的bot,接入bot的联网功能,甚至是上线自己的LLM……由于MyShell之前在自研模型和迭代产品方面的出色表现,用户几乎无条件相信他们可以做出最好的bot产品。

 

最后

当然,我创作的bot远不止文中3个。
除了它们之外,我还制作了更细分的RPG bot和一些通过Prompt Injection实现的奇怪bot。你可以到我的个人blog查看简介与玩法。

如果你想试试我做的 bot,可以使用我的邀请码进行注册——使用我的邀请码会获得几乎双倍的免费聊天额度
当然,如果你介意的话可以在浏览器内删掉链接后面的邀请码,按照你的习惯来即可。

如果你对在这个平台制作bot感兴趣?欢迎一起来玩!最简单的bot只需要几分钟即可。
对于 bot 新手,你可以看看我 7k + 字的经验贴:从设计到落地:捏出被爱的 bot

未来,希望每个人都可以享受bot带来的便利。不仅是功能与信息上的,还有 bot 用鲜活语音带来的人类温度。