上周五,Rokid 在杭州办了一场名为「向 AI 而行」的 Open Day,把 YodaOS、乐奇 AI 助手 2.0、新一代 Rokid AR、AI 头盔、以及微信、支付宝的双接入一并摆了出来。

会后的媒体访谈时间,Rokid 创始人祝铭明提到一桩反常识的麻烦:因为开发变得太容易,容易到「审核成了瓶颈」,而这种压力是 Rokid 过去从未设想过的。一家硬件公司被开发者的产量淹到审核跟不上,产品讨喜是一方面,更主要的原因是 Rokid 是第一个以 Agent 作为主要应用场景承载的实体。

而这正是这场发布会真正的主角。Rokid 把 YodaOS 定义为「全球首款智能眼镜 AIOS」,所呈现的新品与业务背后,核心动作其实只有一个:把 app 删掉。

删的是 APP,改的是交互底层逻辑

从 DOS 到 Windows 再到今天的智能手机,人机交互始终围着屏幕、图标和 app 展开:用户想获得一项能力,先得找到对应的应用,再沿着一条预设的操作路径一层层点进去。眼镜的显示面积、输入方式和佩戴环境都与手机相去甚远,自然无法把这套操作逻辑直接搬上鼻梁。

过去一年里,不少企业尝试用 AI 把手机上的 app 串起来,替用户在不同应用间自动跳转、执行任务并汇总结果,祝铭明给这种做法起了个并不客气的名字——「GUI 时代最后的倔强」。在他看来,AI 被放在了一个并不为它设计的台上跳舞。

YodaOS 给出的另一种解法,是让用户直接对 AI 提出需求,再由系统负责理解意图、调用服务,并决定用什么形式把结果呈现出来。这套系统通过极速交互入口、多维感知、智能体和生态接入,乐奇想让眼镜不再只是被动应答的工具,它能够看见环境、听懂意图,并把事情办成。

落到体验上,这套架构最直观的变化来自这次发布的 AIUI 框架。过去 AI 眼镜的输出大多停留在「念一段话、显示一行文字」的层面——问一只股票,得到的也只是一串文字描述。AIUI 要做的是把信息升级为「富内容」:同样问股票,后台会根据问题自动生成一张 K 线图,直接呈现在眼前。

配套推出的乐奇 AI 助手 2.0 则包含了两处升级,一是主动智能,通过本地执行,让 AI 能在用户没有开口的情况下主动提醒;其次是 AIUI 原生图形框架,现场演示的「乐享世界杯」智能体,可以让用户边看球边与 AI 互动。作为首先支持 AIUI 框架的 AI 操作系统,YodaOS 把开发门槛也压得相当低——一名完全不懂代码的设计师,两天就能做出一个 AIUI 智能体,开发者即日起即可登录 Open.Rokid.com 获取这套全栈能力。

不过听上去最具想象力的「主动智能」,Rokid 自己反而处理得相当克制,并没有把它当作核心功能谈及。祝铭明认为这件事的边界尚未厘清,所谓「主动」,意味着由 AI 来决定何时开口、何时替用户做事,而这个分寸目前仍待进一步划定。这种克制是有道理的,但它也恰好暴露出这套系统当前仍需补足的一环——当 AI 从「答你所问」走向「主动替你做」,它究竟该在何时收手、又由谁来划定这条线,Rokid 给出了方向,却还没能给出答案。

没有 APP,开发者靠什么活下去

APP 被删掉之后,平台几乎只剩下一条路可走——开放,让外部的智能体和服务直接接入。这既是 Rokid 主动选择的差异化策略,某种程度上也是一家创业公司在缺乏原生软件生态时的必然——它手里没有苹果、谷歌那样的存量应用,于是只能把生态本身做成开放的。

从数据看,这条路确实带来了一定规模。Rokid 的智能体商店上线约 6 个月后,已上架 440 多个智能体,另有 5000 多个处于审核与开发迭代之中;开发者社区注册人数超过 3.3 万,还有 30 多名讲师参与其中。Rokid 每年举办的 Spatial Joy 开发大赛已经办到第四届,覆盖 14 个国家和地区、2000 多支队伍、168 件获奖作品,累计发放奖金 600 万元。

在这些智能体之外,乐奇还拿下了一个「全球第一」——成为全球第一个接入 OpenClaw 的 AI 眼镜。OpenClaw 是 2026 年爆火的开源 AI Agent 框架,Rokid 通过灵珠平台开放了自定义智能体,开发者可以把眼镜接入本地或云端的 Agent。其分工大致是:眼镜负责「看」与「听」,OpenClaw 这类 Agent 负责「想」与「做」,二者合在一起,构成了一个真正拟人的助手。

但在「生态繁荣」这层叙事之下,祝铭明也讲了一段相当诚实的话:开发者眼下很难靠 C 端赚到钱。他在会后群访中坦言,消费级 AI 眼镜的装机量本就有限,养不起独立开发者,因此 Rokid 当前的做法是先在 B 端把开发者养起来——文博、工业巡检这些刚需场景,已经有上百支团队依靠 Rokid 的 B 端业务实现常态化运营。

至于独立开发者何时能在 C 端站稳,他给出的参照是有效用户突破 200 万台——当年 Quest 也是在装机量达到这一量级后,开发者才真正涌入。到那时,Rokid 计划上线 Token 分成模式,用户购买并经由 Rokid 消耗的 Token,其收益大部分归开发者所有,这在 AI 行业中尚属少见的结算方式。

把「开放」作为壁垒

如果说 YodaOS 解决的是交互逻辑,那么生态接入解决的就是「删掉 app 之后,用户在眼镜上到底能干什么」。Rokid 这次最硬的「首发」,是第一个同时接入微信扫一扫与支付宝两大体系的 AI 眼镜——在一个被微信、支付宝、抖音等超级应用切割得泾渭分明的市场里,能把两套支付生态同时收进一副眼镜,本身就是一种稀缺能力。

围绕这两大平台,Rokid 把生活服务铺得相当密集。支付宝一侧新增了话费充值、城市伴游、共享单车扫码骑行与停车缴费;高德地图带来了 AI 一键打车,车牌、颜色、距离与到达时间会直接显示在眼前,省去反复掏手机确认车辆的动作;京东与京东健康上线了「看一下买药」,对着药盒看一眼,就能在京东检索并下单;Rokid 还与可孚合作推出了动态血糖仪套装,当血糖过高或过低时眼镜会主动提醒,而这套方案的关键在于,AIUI 能够直接连接蓝牙设备,整个过程无需安装任何 app。微信一侧,按生态负责人蔡国祥的说法,Rokid 对接的是微信扫一扫的整个生态,支付只是第一个落地的场景,后续还会陆续接入更多能力。

「开放」同样是 Rokid 在海外打出差异的底气。祝铭明用日本举例:Rokid 在当地卖得比 Meta 更好,一个直接原因是它可以调用 DeepSeek、Gemini、OpenAI 等多个模型,而不被锁死在 Meta AI 之上,不少日本用户对「只能用 Meta AI」并不买账。他还提到,这次 AIOS 之所以能够做成,前提是高德、京东、支付宝这些大厂愿意把底层数据与接口向 Rokid 开放——而这并不多见。

新硬件,是为三五年后铺的路

而在发布会上亮相的两个硬件——新一代 Rokid AR 与 AI 头盔——则更适合被当作论据来看,它们真正指向的是一个更靠后的时间表。其中 Rokid AR 最值得注意的动作,是把产品名里的「Lite」摘掉了:在空间计算这条线上,Rokid 想证明自己同样接得住。

Rokid AR 延续了分体式结构,由一副 AR 眼镜与一个独立计算主机组成。眼镜端采用 Micro-OLED 微显示器搭配混合波导,视场角做到 58°,配备空间摄像头与 AI 摄像头,支持 6DoF 定位与手势追踪——用户可以把虚拟窗口固定在现实空间里,甚至绕到窗口背后去观察它。它还默认支持 4D 视频:通过 4D 高斯完成空间重建,生成之后能在数字场景里自由改变观看位置,围着一个录好的人或一只猫做 360 度环视。

AI 头盔则由 Rokid 与一家头部头盔厂商联合研发,交由意大利设计师操刀,针对亚洲人头型开了三个尺寸,并通过了 ECE、CCC、DOT 三项认证。它真正的用法在于和 Rokid Glasses 打通:头盔预留卡槽,可以把眼镜直接插进去,配合磁吸充电口,骑行时用眼镜做 4K 循环录像替代行车记录仪;此外还有抗风噪的头盔语音模式,以及能在地图上看到队友位置的组队模式。这款头盔计划在今年第四季度发售,分普通版与碳纤维版两个版本。

这些硬件服务的是同一个更长远的目标。祝铭明在会上给了一个明确的节点:再给 Rokid 三到五年,把 Rokid Glasses 与 Rokid AR 合成同一个产品,让眼镜具备今天 Rokid AR 的全部能力。眼下的 AR 主机、头盔与 4D 视频,都是在为那一天做准备。

门正在打开,但发令枪还没响

Rokid AI 眼镜今年上半年在日本众筹平台拿下 6.3 亿日元的好成绩,刷新了当地十三年的最高纪录;在美国 Kickstarter 也做到了 402 万美元;刚刚结束的 618,官方口径同比增长约 6 倍,发布会上祝铭明那句「火箭已经点火升空了,不要再质疑它会不会起飞」,听上去底气十足。

但在会后群访里,他本人的判断却又变得克制。祝铭明把眼下的智能眼镜阶段比作「iPhone 1 之前的 BlackBerry 时代」:真正的长跑还没开始,门正在打开,发令枪却迟迟没响。他估计要到明年比赛可能才会正式开始,理由是行业至今没有找到一个 AI 眼镜专属的 Killer app,做不到像当年「切水果」之于多点触控那样——一提起这项技术,就能立刻想到那个独有的、所有人都接受的应用。眼下的绝大多数内容,仍然只是把手机生态平移过来,而 Rokid 七成的研发精力,也还花在兼容这些旧生态、保证产品基础可用上。

但无论如何,YodaOS 为「删掉 app」给出了一个像样的答案,也是 Rokid 为智能眼镜搭建操作系统地基的重要里程碑,远景与产品并行,我们期待它的表现。