前言

创业不易,硬件创业更难,尤其是 AI 硬件创业更是难上加难。

难也意味着门槛。在滚滚而来的 AI 大势之下,门内的景色金光闪闪,首先要做的是迈过这个门槛。

准确地说,我的硬件项目正式研发到投产经历了 108 天。对于种子期的公司来说,已经是一个值得开心一下的成绩了,就别骂我标题党四舍五入了。

撰写此文,一方面是对走过的路做一个复盘,另一方面也希望借此为即将或正在走上这条路的同道中人提供参考和借鉴,希望道友少走弯路,早日成道。更希望借此机会结识更多道友,常论道而共勉之。

不过在讲这 108 天的故事之前,还是先介绍一下我们到底做了什么。

我们做的这台设备叫 scymain AI 对讲机。你可以把它理解成一个更直接的 AI 语音入口:开机、按住说话,AI 就会回答。不需要先解锁手机,不需要打开 app,不需要盯着屏幕找按钮,也不需要对着输入框打字。

scymain AI 不是想替代手机,也不是一台小手机。它更像一个可以放在桌面、床头、车里、厨房,或者交给家里老人和孩子使用的,「随口问 AI」的小东西。

今天起,scymain AI 对讲机已在少数派现货发售。完整的产品参数、包装清单、功能说明、服务权益和购买方式,都整理在了产品详情页里,感兴趣的朋友可以点击查看:

前往产品页面

而在这篇文章中,我主要想聊聊:我们为什么会做这样一台 AI 硬件,它是怎么从一个念头走到试产和现货发售的,以及为什么我们认为,在手机里已经有各种 AI app 的今天,一个实体的 AI 对讲机仍然有存在的价值。

故事要从我爸说起

故事还要从头说。

自从老爸搬来广州住我们附近,我发现他不喜欢出去遛弯了。问他为啥,他说找不到路。

老爷子是不太会用智能手机的,更不要说导航了。我说你可以打电话问我啊,他说腿脚不方便,待在家里挺好。其实我知道,他是怕打扰到我。

当时刚好看到一个挺火的开源硬件项目「小智」,我也折腾了一阵,就想着能不能给老爷子弄个出门问路的小玩意。倒是鼓捣出来了,但是发现定位不精确,问路不好使;不过回答健康养生、做饭养花之类的问题,倒是很有情绪价值。

这次经历也为我后来做产品奠定了很重要的一个判断:智能手机让很多事情变得更方便,但也让一部分步伐「慢」一点的人,被复杂的操作路径挡在了门外。而 AI,带来了一次重新降低使用门槛的机会。

例如,很多长辈不是不想用技术,而是卡在第一步:不知道 app 在哪,看不清屏幕,不知道该点哪里,也不知道自己按错了会发生什么。如果交互只有「按住,说话,听回答」,事情就会简单很多。

当然,AI 给出的健康、法律、生活建议都只能作为参考,不能替代专业人士。但对很多日常小问题来说,它至少能让老人多一个可以随口询问的对象。

再后来碰到的一件事,坚定了我要做这个产品的决心。

有次我约了人,对方迟到,闲着没事就去逛隔壁的邓世昌博物馆。没有讲解器,也没有工作人员,展品和背景板的文字介绍信息量非常少。于是我一路用手机问着千问一路逛,无意中却获得了最棒的一次参观体验。

AI 不但解答我各种刁钻飘忽的问题,从木船结构到蒸汽机原理,从火炮威力到清末经济,从官员服饰到梁栋花纹,甚至还帮我分析穿越回哪一年煽动翅膀才能改变战局。

在这次游览中,AI 的专业与风趣,给了我远超以往博物馆游览经历的体验。我意识到,AI 给我的这份感受,对于其他人来说,应该是同样有价值的。

最开始,它其实是一个导览终端

于是从去年底开始,我们开始调研 AI 在观展导览里的需求,2 月初去一家博物馆做了实地调研。

年前我们基本确定了目标。最初计划做的产品,主要用于博物馆、景区的智能导览,以及供销展会的智能导展场景,实现从「录音播放」到「千人千面问答」的交互升级,同时解决「观展盲目逛、离展即断联」的问题。

2 月底,这个产品正式立项,从锁定需求开始推进。既然是硬件产品,开头要考虑的问题就是外观。因为最初构思的场景是放在博物馆景区给游客租赁,我希望外观能让最广泛的群体都接受。想破头也没个思路,于是找到了一位工业设计大师。

我虔诚地请教:「什么样的外观,男女老少、中外友人都喜欢?」

结果大师一顿棒喝:「你想啥呢?做你的春秋大梦,根本不存在所有人都喜欢的外观。」

于是,我放弃了设计出一个完美外观的幻想。柳暗花明,正巧看到康康(家里的宠物龙猫)那副萌蠢的样子。我想,既然我希望做一个老人和孩子也愿意主动拿起的硬件,宠物一般的亲和感也是交互体验的一部分。既然如此,外观就它了吧。

这也是为什么 scymain 看起来不像一个严肃的电子设备。它有点像一个小玩具,有点像一个桌面摆件,也有点像一个会回答问题的小伙伴。

我们砍掉了很多功能

外观设计是个反复的过程,像小火烹海鲜,急不来。也没必要心急。这个阶段刚好可以用来忙一大堆的事情,特别是梳理用例、确定功能设计。

这个过程其实挺难的。难点不在于梳理出多少用例,设计出多少功能,有没有遗漏。难点在于有多少资源,能满足多少功能,该如何取舍。

我给自己找了个方法,叫砍功能三问:如果一个功能不做,整个系统是还能跑起来,还是会卡住或崩溃?如果一个功能不做,用户是会感到明显的缺失,还是其实毫无感觉?这个功能对应的用例是首创,还是已经在其他产品上存在?

如果答案是前者,直接砍掉;如果是后者,保留继续优化。

例如视觉功能。目前很多大模型已经有很好的视觉识别能力了,加个摄像头也不是什么难事。但是考虑到语音终端还是要将语音交互放在第一位,核心要点是降低语言延迟,而不是更强更全。视频处理也会牺牲能耗和续航,所以砍掉了。

再比如触摸屏。类似智能手表的交互固然会让体验更好,但考虑到手指头粗的用户会难交互,牺牲视觉交互后反而会让语音交互更专注,降低交互复杂度。再加上成本、良率、能耗、鲁棒性等诸多综合因素,最终也放弃了。

所以 scymain 最后没有被做成一台小手机,而是更像一台 AI 对讲机。我们希望它专注把「语音问答」这件事做好,而不是让用户重新回到看屏幕、点按钮的交互里。

功能设计确定之后,我们把它打印成正式的纸质文档,精美地装订好。我希望用这种仪式感时刻提醒自己:蓝图已锁定,变更要克制。后面每次变更都做这一步,迫使团队对变更有敬畏心,思虑清楚了再变更。

硬件工程的生死时速

功能确定了,电子设计就可以动起来了。这里我的经验是:原理图一出,绝不要等,直接找供应商打样。这个阶段不要省钱,能发顺丰绝不发京东。原理验证早一天,整体进度就快一天。

此外,为了让结构设计提前开工,我们采用的估算方法是,把打样回来的关键电子元件在白纸上平铺开,铺开的面积乘以 130%,基本就是电路板的大小。当然,这么做是有风险的,我们也踩了坑,不过办法总比困难多,后面我再慢慢说。

结构设计是初创团队最容易「赌命」的环节。 实验室里做 demo,失败一百次成功一次就行;但量产的标准是连续做几万件,只要有千分之一的失败率,直通率就可能跌破及格线。

因此,对量产和结构设计,必须保持极度的敬畏。

另外提醒一句:外包工业设计时,千万别签「免费改 3 次」的合同,哪怕总价贵一点,也得让对方同意必须「改到满意为止」,并把 30% 的尾款留到试制阶段验证了可制造性之后再付。

跨越量产鸿沟:3D 打印、贴片机与复模手板

结构设计也是一个考验耐心的阶段,绝对不能将就,不能凑合。这个阶段我认为我们做对了几件事。

第一,两台 3D 打印机连轴转。几百块淘的 FDM 打印机用来粗调,24 小时不停机;一千多块的光固化打印机用来验证精度。每一个版本的结构都要反复验证。

第二,自购桌面贴片机和回流焊。为保精度,我们花了五位数买了全新的桌面贴片机。虽然效率比不上大厂,但质量绝对是人工手贴望尘莫及的。

第三,做了硅胶复模手板。验证结构设计最主要的其实并非可用性,更重要的是验证可装配和可制造。诸如干涉之类的低级问题可以看图纸发现,但装配和制造非得摸到实体才能体会。

复模手板到手后,可以先出一个简单的装配图纸,能画图就不写字。然后下单请个家政服务,多给一个钟的钱,让家政阿姨尝试照着图纸装配。(亲妈也行。)

这时,重点观察三个问题:一是装配空间。普通人的手指塞不进的地方,流水线工人肯定也会出问题。二是防呆设计。普通人把线插反、组件装反的地方,必须重做防呆。三是易损节点。鼓励大妈暴力装配,哪里开裂断裂,哪里就改设计或换材质。毕竟量产线上的操作,只会比普通人更暴力。

一直到装配挑不出什么毛病了,模具供应商就可以介入了。

复模手板的另一个作用,就是带着手板去跟模具设计的老师傅聊,要比拿着图纸去聊效率高得多。

模具行业吃的是经验。设计师靠软件计算脱模斜度、顶白、收缩率,而老师傅靠的是那双布满老茧的手。捏一捏软硬知道哪里加筋,摸一摸弧度就知道脱模难易。把实体手板交给他们,让他们直接在上面画线标注,结合双方的智慧,才是利益最大化的做法。

就这样死磕了一个多月,我们最终开了 9 套模具(注塑+五金)。结果令人欣慰:7 套一次试模通过,2 套二次通过,无一返工。

在此也建议预算充足的团队:外观件注塑模具最好直接开两套(一套钢模,一套铝模)。铝模进度快,可以为钢模修模做预演;万一钢模出问题,铝模还能顶上应急。这笔钱,相当于给产品进度买了份保险。

意外的转折:它不仅仅是个导览机

直到这时,我都以为我要做的是个导览机。

但计划赶不上变化。在测试阶段,我们把它连上了当时很火的 OpenClaw(小龙虾)智能体平台。原本在手机上用飞书找「小龙虾」打字聊天非常繁琐,但接上实体设备后,大家发现动动嘴叫 AI 干活简直太爽了。

我们意识到,这个设备的潜力远不止导览——它为什么不能是一个 AI 语音小秘书呢?

例如,你可以跟它聊老妈的健康、孩子的作业、车子的保养。只要告诉它分类建档,下次再聊时,它能自己读取上下文跟上节奏。

又如,在电脑上写长篇提示词很麻烦,但拿着对讲机,你可以零零散散地把要求说给它听,最后让它自己整理成结构化的长任务提示词。

还有,我开车时脑子里蹦出的零散思路,随口丢给它,它不仅能整理成文,还能提供极高的情绪价值——AI 的鼓励和肯定,比半夜抓破头皮死磕大纲爽多了。

不过,真正让我决定转换产品方向的,是两件小事。

第一次是有次等车,我听到旁边一位阿伯开着外放,电话那头(可能是他儿子)教他用地图。儿子让他点「一滴血形状的图标」,阿伯点开了百度地图;儿子又让他找一个「像吊灯的按钮」,接着问他选「拒绝还是同意」。阿伯选了同意,结果手机直接跳到了淘宝。那一刻,看着阿伯无助的眼神,我心里很堵。

第二件事,团队小伙伴的爷爷有三高,孙子教他用「豆包」查忌口。爷爷学会了按住说话,但因为老花眼看不清屏幕,忘了开语音播报时急得发脾气。后来孙子把我们的测试样机接上豆包给爷爷用,爷爷给出了极高的评价:「按住讲话直接听声音,不用看屏幕,太好用了。」

于是,我们决定了产品的新方向——为大众,尤其是银发族和需要「免提」交互的人群,做一款纯粹的 AI 通讯终端,就叫做 AI 对讲机。

它支持绑定 OpenClaw、千问、Kimi 等多种智能体,内置了老民警、李医生、黄大厨等拟人化的 AI 专家。自带 4G 网络(室内也可连 Wi-Fi),基础 AI 服务终身免费,每月自带 100M 流量,真正做到了无门槛开机即用。

由于功能增加,电路板面积也随之变大。幸运的是,之前在结构上下预留了空间,我们把电路板拆成两块单层板,在不改模具的情况下顺利解决,省下了一大笔钱。

开机即用,让 AI 真正触手可及

确定了设计,也重新调整了方向,接下来还要熬过漫长的模具制造期。这时,我们把精力放在了打磨软件和固件上,为了开机即用而努力。

「开机即用」听起来简单,实际上是一个 AI 硬件存在的全部意义。在我做产品的过程中,许多亲戚质疑过(你可能也在质疑同样的问题):手机 app 什么都能干,Siri 也能语音,为什么要单独带个硬件?

我的回答是:当你开车、做家务、满手油污,或者只是疲惫地躺在床上时,你是愿意掏出手机、解锁、在一堆图标里找到 App、跳过开屏广告、再点击语音按钮;还是愿意直接按住一个实体按键说话?AI 对讲机的意义,就在于让 AI 在脱离屏幕的场景下,变得随手可用。

现货发售,欢迎来挑刺

讲到这里,这台小东西终于从一个念头,闯过了手板、模具、试产的九九八十一难,走到了可以交到大家手上的阶段。

今天起,scymain AI 对讲机在少数派现货发售。如开头所说,它不是一台万能设备,也不是要替代手机里的 AI app,而更像是一个更轻、更直接的 AI 入口:当你不想解锁手机、不想打字、不想看屏幕时,可以直接开口获得帮助。希望大家喜欢,也期待听到大家的意见。第一代产品肯定还有很多可以改进的地方,我们也希望把真实用户的反馈,继续带回下一轮产品迭代里。

对了,我们还顺手设计了硅胶皮肤「咕咕嘎嘎」,当个桌宠也非常不错。

前往产品页面

欢迎在评论区告诉我们:

 

  • 你会在什么场景下使用这样一台 AI 对讲机?
  • 你会把它放在桌面、车里、厨房、床头,还是交给家里的老人和孩子?
  • 你最希望它继续优化什么功能?

我们将在一周后选择 2 名发布优秀评论的用户,赠送 scymain AI。