尽管各家的智能语音助手日益强大,但就目前而言,Siri、Google Assistant、Cortana 等尚不足以在工作或游戏中协助我们。在这种现状下,如果我们仍想用语音操控电脑,有没有什么办法?至少在 Windows 上,答案是肯定的。
或许你已经想到,和 Mac 一样,Windows 本身是支持语音控制的(控制面板 → 语音识别 / 设置 → 轻松使用 → 语音 → 打开语音识别)。但是,我们从这个功能的打开方式和 「Windows 语音识别命令」 中可以感受到,似乎它更多地是作为「轻松使用」的一部分,帮助不便使用鼠标、键盘的人士来操控电脑。
这样的语音操控方式并不能算是「用语音操控 Windows」。本文不是一篇介绍 Windows 原生语音控制功能的文章,而是旨在介绍一款把控制 Windows 的方式拓展到语音的软件: VoiceBot。
为什么使用 VoiceBot?
使用 VoiceBot 最基本的原因是它的功能较为完善、稳定,且有较高自由度。
在此基础上,VoiceBot 和其他同类软件相比(例如 GAVPI、VoiceAttack ),在界面、售后、技术支持、易用性等方面更有优势。
除此之外,如果你克服了对着电脑下命令的莫名「羞耻感」(或之类的东西),以简单命令触发一系列自动化操作的功能,的确能免除你部分重复而繁琐的操作,还能让你的双手得到休息,释放部分压力。
在游戏中使用 VoiceBot 或许能增添游戏的趣味。例如,你可以在策略类游戏「文明」中,让语音命令「退朝」对应游戏中点击进入下一回合的操作。或者将某游戏中使用技能的快捷键对应为某句「咒语」。
如果你有更丰富的想象力,那你能用 VoiceBot 带来的改变和趣味或许会超出其他人。
VoiceBot 界面介绍
从两个最基础的界面开始介绍 VoiceBot 。
VoiceBot 配置文件界面
上图是 VoiceBot 中编辑配置文件(Profile)的界面。一个配置文件是一组宏的集合,是用于同一情景下的一组语音命令规则。例如,在使用 QQ 邮箱时,语音命令「删除邮件」可能代表将鼠标移至某处再单击;而在使用 Gmail 时,「删除邮件」命令可能要将鼠标移至 Gmail 中删除邮件按钮所在的位置再单击。不同的情境下同样的语音命令可能代表不同的操作。在不同的情景下使用不同的配置文件,可以避免出现语音命令错误、混淆等问题 。值得注意的是,切换配置文件这一行为也能通过语音完成,不必打开软件进行操作。
「必需」区域中有「配置名称」和「配置文件语言」两项。
「配置名称」:事实上,配置文件的名称可以和其他配置文件重复,不过若没有特殊需求,非常不建议这样做。
「配置文件语言」:每个配置文件只能设置一种目标语言,而不同的配置文件可以使用不同的目标语言。「添加识别器」这一按钮似乎已经失效,此时可以通过 设置(Win 键 + I) → 时间和语言 → 区域和语言 → 添加语言 来添加其他语言的识别器,用其他语言来对 VoiceBot 下命令。这也意味着,你能在 VoiceBot 中使用所有 Windows 能识别的语言。
「宏」区中是此配置文件中包含的所有宏,或者说语音命令规则(如果这样说更好理解)。一个宏可以有如下属性(标「*」为必需):
名称*
宏热键:绑定了热键(快捷键)的宏可以用快捷键激活。
命令*:「命令」即需要说出的语音指令,默认情况下和名称相同,取消选中「名称用作命令」后可以设置为不同的内容。
组*:虽然是必需的项,但实际上此项不可能为空。默认情况下,新建的宏属于「常规」组。可以添加组。
动作*:「动作」即语音指令对应的操作。一条语音指令可以对应单个或多个动作,并且动作之间可以添加延迟或注释。
「可选」区域有如下五项内容,都不是一个配置文件所必需的:
命令前缀:如果一个配置文件设置了命令前缀,那么使用时每个命令都必须加上此前缀,才会被 VoiceBot 识别运行。例如在有和没有命令前缀「嗯」这两种情况下,应使用的语音命令分别是「嗯返回桌面」和「返回桌面」。在 VoiceBot 设置中可以设定全局的命令前缀,但是此处的设定会被配置文件中的覆盖。另外,似乎 VoiceBot 不支持中文的命令前缀。如果各位有兴趣的话不妨给我反馈。
关联此配置文件和指定程序:其实这项应该翻译为「关联此配置文件至指定程序」。如果一个配置文件和某程序关联,那么如果此程序没有运行,就算启用了配置文件、说对了语音指令也不会起效。
配置文件热键:此项功能和「宏热键」的功能相似,设定好后,就能通过按下特定的快捷键来启用某一配置文件。
描述:配置文件的描述。
已链接的 WallpaperFusion 标签:如果从给出的标签列表里选中了某一标签,那么使用该配置文件时,主视图中会加载相应的图片。如果没有选定,主视图中图片会随机加载。
VoiceBot 主视图
上图是 VoiceBot 的主视图(当主视图位于所有窗口中最前时,VoiceBot 不会执行识别出的语音命令)。从上到下,我们可以看到一个工具栏、两个窗格和一个横幅图片。
工具栏左部显示当前使用的配置文件,单击后出现选择配置文件等的下拉菜单。相邻的两个按钮从左到右依次是「编辑配置文件」和「下载预制配置文件」。在右部,先是「用于 VoiceBot 的音频输入设备」(当没有其他设备可选时此项为灰色),它旁边依次是「暂停(开始)」「清除日志」(接下来就会说明何为日志)「设置」「帮助」和「退出」。
两个窗格中,左部较窄的窗格显示当前配置文件所包含的宏及宏对应的「命令」,不同组的宏分开显示。双击某个宏即可快捷地跳转至其编辑界面。
右部较宽的窗格显示本次 VoiceBot 运行的日志,即所识别出的语音以及(如果有)对应的宏和宏所代表的「动作」。可以设置只记录匹配了「命令」的语音。
底部的横幅图片,正如刚才在「已链接的 WallpaperFusion 标签」中所介绍的,如果配置文件有相关设置,会加载特定图片,如果没有设定,则会随机加载图片。除了图片之外,底部还有一条随声音大小而起伏的线。若当前无声音,则线之下为黑色,若有声音,线之下变为蓝色。
VoiceBot 的功能
在 VoiceBot 的官网上有一段简介,清楚地介绍了 VoiceBot 的核心功能:
VoiceBot lets you take command with your voice! Say commands out loud to send actions to your games and applications. Use your voice to type keyboard shortcuts, click and move your mouse, and execute macros and scripts.
简单地说,在 VoiceBot 中的宏能完成以下「动作」:
键入快捷键
控制鼠标
执行宏脚本
更改音频设备
打开文件或程序
播放声音
文本转语音
输入文本
接着我们来详细介绍这些「动作」。
键入快捷键
快捷键由按键方式和按键内容组成。VoiceBot 支持的按键方式有四种:
按下并释放按键
按下按键
释放按键
切换键
前三种按键方式很好理解,最后一种「切换键(Toggle Key)」指的是根据当前选定键的状态,按下或释放按键。如果选中的按键方式是「按下并释放按键」,则还可以设置按住的时长(以毫秒为单位),默认时长为 100 毫秒。
至于按键的内容,可以看到编辑按键的界面有四个灰色的按键(单击选中后即变为蓝色),分别是:Shift、Ctrl、Win 键和 Alt,这四个键可以有无任意组合(即可以组合出 16 种可能)。白框中可以再加入一个任意键。加入方法有两种,一种是点击白框使光标出现于此后,直接在键盘上按下目标键,另一种是点击白框右侧的黑色箭头,从弹出菜单中选择某个键。
控制鼠标
VoiceBot 能控制鼠标完成如下动作:
单击
双击
按下鼠标
释放鼠标
移动鼠标
滚动鼠标滚轮
前四项的编辑面板和快捷键的编辑面板大同小异,除了在白框中直接点击鼠标目标键之外,还可以从弹出菜单中选择。
移动鼠标分为两种模式,都是根据坐标移动。一种是绝对移动,将鼠标移动至指定坐标;一种是相对移动,此时填入的就不是目标坐标,而是指定的坐标增量。VoiceBot 提供查看鼠标坐标的功能。在绝对移动模式下点击「显示选择器」后,再点击目标位置,目标位置的坐标就会自动填入编辑面板内。
如图所示,滚动鼠标滚轮和点击鼠标时,都可设定按下 Shift、Ctrl、Win 键和 Alt 中的某个或某些。
宏脚本
VoiceBot 支持以 C# 或 Visual Basic 编写宏脚本,也可以下载预制宏脚本。本文不涉及相关内容,如果您对在 VoiceBot 中使用宏脚本感兴趣,可以访问官方的 相关帮助页面 了解详细内容。
更改音频设备 & 打开文件或程序 & 播放声音
VoiceBot 支持更改声音和通讯的回放和录制设备,也支持打开任意文件或运行任意程序。VoiceBot 以相应的系统默认软件打开指定文件,运行程序时能够给程序传递命令行参数。用 VoiceBot 打开文件和播放声音的操作基本相同。
文本转语音 & 输入文本
VoiceBot 能将特定文本转为语音并播放。并且还可以选择使用的语音声音或 下载更多的语音声音。用户还可以按自己的喜好或需求设定语音的音量和速度。这些设置项也可以在 VoiceBot 的「设置」里面更改,但是「动作」中的设置优先级更高。
输入文本的功能很简单,就像输入法的自定义短语一样,就是输入特定的文本内容(而不是语音转文字)。
其他功能
除了这些「动作」之外,VoiceBot 还有一些提升使用体验的功能:
- 如果用户注册了 Binary Fortress 账户(不注册账户不影响使用软件),那么用户可以将自己的配置文件同步到 VoiceBot 的服务器上。这样,通过登陆自己的账户,就可以在任何地方使用自己的配置文件,也不用担心因为系统故障等原因而丢失自己辛辛苦苦编辑的配置文件。
- VoiceBot 支持用户分享自己编辑的配置文件,提供给其他用户下载使用。目前,已有较多配置文件被分享,但其中大多数是适用于英语的文件,适用于中文的配置文件只有十几个。若非特别紧急的情况,大家不妨自己编辑自己的配置文件,这样使用起来更加「顺手」。另外,如果只想发送给朋友的话,VoiceBot 提供配置文件的导出、导入功能。
如何购买 VoiceBot
如果您想购买 VoiceBot 这款软件,有多种途径可以选择。例如在 官网购买、在 Steam 购买 和在 数码荔枝购买 。
VoiceBot 的授权版本
在官网的销售页面,我们可以看到 VoiceBot 的授权分四个版本(包括免费版在内)。
本文并没有截出不同版本可用功能对比的表格,因为除了免费版有所限制之外,其他三个版本在此方面并没有任何区别。
Steam 版的 VoiceBot 和 Steam 上大部分游戏或软件的授权模式相同——不限制安装的设备数,可终身更新(所有的版本都是这样)。而且在官网的授权详情中可以看到,所有收费版本都是可以商业使用的。
数码荔枝出售的 VoiceBot 所标注的版本是「专业版」,但在授权详情中有说明,此版本的 VoiceBot 只能用于一台设备。和官网的相对比可知,数码荔枝出售的应该是「Pro Standard」版本,具体的授权说明是:「Personal or Company, 1 computer」。
「Pro Personal」版不在数码荔枝和 Steam 出售,它和「Pro Standard」版的区别在于,「Pro Personal」版能使用于不限数量的个人电脑,和一台仅自己使用的公司电脑。
VoiceBot 的价格
上表列出了不同平台 VoiceBot 的「正常」价格。一般情况下,数码荔枝会有几元的折扣。而 Steam 上的 VoiceBot ,在促销时(例如夏促)价格可能会降到 21 元。
我们可以看到,无论是从价格上,还是从授权上,在 Steam 购买都是最好的选择——除非你决定在不能使用 Steam 的电脑使用你的 VoiceBot。
其他
最后有几点附加说明。
限于篇幅,本文并没有介绍出 VoiceBot 的全部功能。
VoiceBot 的语音识别能力受复杂因素影响,有人在 Steam 反馈说根本用不了,我用起来觉得还行。
- 在 Steam 购买还有一个好处。Steam 的退款政策是,在购买后两周内,如果使用时间不超过两小时,可以申请退款。各位感兴趣的话不妨在 Steam 买来试试,不喜欢再退款,到账很快的。