关于我:十年 iOS 开发,目前全职独立开发:打工人小组件(App Store 首页推荐,安卓开发中)

苹果 Vision Pro 发布以后引起了很多的争议,有人看好,有人不看好。作为一个苹果生态的移动开发者我的观点是:

非常认可 Vision Pro 的技术路径,在这条路径下目前的 Vision Pro 完成度相当高。Vision Pro 开启了空间计算的新时代。

两万多的售价注定和大众消费市场无关,未来五年内价格也无法被大众市场接纳。 但是科技创新的评价从来和大众市场的认可度无关(资本关心,科技不关心)。第一辆汽车和大众无关,第一台电子计算机也和大众无关。甚至第一批抗生素也和大众无关。讨论一个新品类第一代产品的性价比是无意义的。如果这个产品的技术路径是对的,有消费需求,随着迭代未来价格会逐步下降的。

评价计算设备的第一性原理

对于新品类,我们不能从现有产品的迭代去评价它。不应该用电脑的标准衡量智能手机,也不应该用智能手机的标准去衡量 Vision Pro。

我们应该从第一性原理去分析这个品类是否处于正确的路径。

那么评价计算设备的第一性原理是什么呢?是信息处理能力。

从两个角度看。从创作角度看:能获取更多、更复杂的信息,原来一些信息处理不了,现在能处理了。从消费端,能呈现更多元的信息,可以消费更多的信息,消费信息的效率提高了。

拿 iPhone 举例。一个显而易见的地方是手机的处理器提升了,有了能力能够进行更复杂的运算(相比功能机)。但是在输入端,iPhone 有了 gps 定位仪,有电子陀螺仪。有了新的信息输入。当一个随身设备能获取定位,自然就有了地图导航能力。在这个之上就可以打车了(司机知道你的位置才能来接你)。就这一个多的信息维度,手机相对于电脑就不是一个相同的品类。所以跟手机对比电脑的性价比是无意义的,本质不是一个品类。

在消费端大屏的触摸屏提高了信息交互效率。原来如果要点击屏幕的一个位置,无论是滚轮还是方向键相比直接点击效率都差了 10 倍。这样的交互效率提升对于移动设备是很重要的,因为设备的尺寸小,能承载更多的交互密度就很重要。理论上所有的交互都可以映射到具体的硬件上,电脑上就是。在电脑端大家对触屏就没那么高要求。这是移动设备和固定使用的场景不同决定的。

那么在输入端 Vision Pro 引入的新信息:用户在空间的坐标,用户手的姿态,用户眼球的追踪,用户所在场景的空间信息。消费端:单眼 4K 的屏幕,可以在眼前呈现任何内容。可以把内容融合在现实场景里。

所以现在的问题回到了本质上:一个能感知当前空间,能获得用户在这个空间里的姿态,可以呈现任何内容在人的眼前的设备,有没有提升信息处理的维度?我的答案毫无疑问是的!Vision Pro 开启了一个和现实融合的可交互三维信息的时代。

我们不要思考他是不是能更优雅的处理一个已经有解的场景,要关注他是不是能解决新的问题。

人类所处的世界毫无疑问是三维的。过去一直受限于算力和终端设备,我们无法良好的仿真三维信息。我们只能通过二维的图片,多个角度来让大脑模拟出三维的画面。这中间的信息损耗是必然有的。就像我有一个画面要表现给你,我用文字描述虽然也能大概也能让你有个印象,但是相比我直接给你看一张图片信息一定是损耗的。

下面是 Vision Pro 的几个应用场景。

Image.png

一个医疗类应用,1 比 1 显示人体的模型,当你的手指向某个区域,可以看到里面的骨骼和器官。我之前提过,这类信息以前只能通过二维的信息来抽象表示(图、视频),现在可以仿真真实的情况,信息的损耗变少了。

Image.png

F1 比赛的观看应用。在以前我们只有一个电视画面,我们只能通过多个机位镜头的画面来尽量显示车辆竞争的场景。现在在视频下方有了一个真实赛道的模型,能显示车辆的位置。毫无疑问提升了观看体验。

Image.png
Image.png

通过识别空间中的乐器、人的手势,展示弹奏的辅助信息。

空间计算的正确技术路径

通过上面一节我说明了空间计算这个品类的必要性。有了正确的目标还要有正确的发展路径,否则南辕北辙最终也会失败。只有选择了正确的目标,又有正确的路径,产品最终才能迭代走向成功。

在初期虚拟现实设备有两个路径。眼睛全包围的沉浸式头盔,不显示真实空间。第一批的 oculus 是这个方向。游戏方向的 PSVR 也是这个方向。

Image.png

还有一类是眼镜方向。主张把内容叠加到透明的屏幕上。最有代表的是微软的 Hololens。谷歌已经放弃的 google glass 也是这个方向。

Image.png

眼镜类设备的内容呈现天花板太低,我认为是注定小众的。眼镜的内容要显示在透明的镜片上,显示效果一定会受光线影响。想一想早期的投影仪。如果显示屏要接近眼镜的形态,就会有视场角太小的问题。这个天生的物理限制决定眼镜类无法呈现影院级别的画质。

这是何同学讲 hololens 视频的截图。

Image.png

想要做出最好的视觉效果,必须是显示屏把眼睛全包。那么既然我已经可以模拟出眼睛看到的所有画面,把外部世界的画面用摄像头拍摄和要呈现的内容叠加就可以了。在这个思路下可以控制外界场景的亮度来匹配内容。所以有了现在 Vision Pro 可以调节沉浸度的旋钮。

总结:新一代空间计算的设备的基本形态需要封闭式全包,通过摄像头拍摄外界画面进行融合。这里面有一个隐含的条件,需要能够精确追踪眼球。因为人类观察外界时候会依赖眼球的运动。如果不能精确的捕捉眼球,就无法准确模拟外界的场景。

Vision Pro 关键指标的领先

现在我们知道了 Vision Pro 在正确的赛道上,那么这条赛道上也有其他选手,最后赢的会是Vision Pro 吗?现状是在这个赛道上,Vision Pro 排第一。在几个关键细分领域有着很大的优势。在综合体验上短期内 Vision Pro 没有对手。长期看也许最走量的不会是 Vision Pro。

从基因上说,苹果有消费类电子计算设备的强大背景和号召力。往上一层,首先 Vision Pro 的产品定位一开始就是对的,往对的方向努力。其次苹果的产品有能力把Vision Pro 的价格定在两万以上。

这样一个创新型的新品类,技术普及之前的价格是低不了的。过早的期待大众普及会严重制约产品的迭代。苹果可以按照售价两万五的标准量产这个产品,和要走量高配售价才 3799 的 pico4 真的在做同一个东西吗?巧妇难为无米之炊。苹果在产品上的创新溢价使他的产品在综合体验上有优势,同时也会导致它的产品在技术进入成熟期后不会有销量优势。因此未来技术普及拐点到来的时候,可能后面还会有其他厂家的机会。

一开始战略定位不同,最终对战线就会有根本性影响。Vision Pro 在几个关键指标上领先最终使它具备了开启空间计算新时代的能力。

12ms 的视频延迟

通过摄像头捕捉外界的画面融合到内部画面上这是一个关键的节点。VP 的延迟只有 12ms,这个延迟下人眼睛虽然看到的是和外界一样的视频,但是因为和自己的动作高度同步,所以可以做到以假乱真。

如果延迟高,人的头一移动,场景的画面就会有卡顿感就会严重影响体验。现在的 quest3 和 pico4 的延迟在四五十毫秒。

苹果为了做到这个低延迟,专门用了一颗 R1 芯片来处理视频画面。不得不说是很有魄力的。

交互:准确的手势、眼球追踪

人类在空间中进行交互最符合直觉的方式眼球追踪和手势。我们看向桌面,拿起一个杯子,非常自然的操作。但是早期的 VR 设备都是通过抓着一对手柄实现高精度的控制。

专用的模拟设备固然在某些场景有效率优势,但是不应该是系统交互的基础。在空间中需要抓着一对手柄才能进行准确的交互会非常的影响体验。

Image.png

在 VP 的视频测评中我们可以看到手势的识别和眼球追踪的完成度是很高的,完全可用的。

软件生态:成熟的 VisionOS

还有一个关键的领先是软件生态。软件生态的领先比硬件大的多!硬件堆料的化还是有一个数的,但是苹果软件生态的领先对手很难逾越。

作为一个通用的计算设备,因为苹果软件生态的成熟,iOS 和 Mac 的应用可以很容易移植到 Vision Pro 上。因为软件的底层框架是一致的。只需要针对输入场景做一些调整。VisionOS 一开始就具备了整个苹果的软件生态,站在了巨人的肩膀上。和现在的苹果设备通过 icloud 和 airdrop 流转,是一个相当完善的生态。

反观竞争对手,现在也具备不错软件生态的谷歌和微软,都没有拿得出手的 VR 设备。Meta 和字节短期内没有能力打造一个完整的软件操作系统提供给开发者。Meta的 OpenXR 和 Pico OS 都是基于安卓定制。在系统能力和开发者号召力都远远不及苹果。

整体资源领先

在本质上,Vision Pro 对苹果来说是一个战略大单品,对这个产品可以投入的资源是一个巨大的数字。苹果现在对 Vision Pro 的态度是一个拼了命的富二代。对 Meta 和字节而言,VR 只是一个寻找增长的第二曲线的一个选项,主营业务完全不相关。在战略定位和资源投入上都不可能超过苹果。

总结就是现在领先的苹果,在技术普及拐点前会继续领先。

不要期待智能手机的盛况出现

很多人都在期待一个新的 iPhone 时刻。我觉得这是不切实际的。不仅是苹果,我想消费类电子设备在基础物理有巨大进步前不会再有 iPhone 时刻了。

手持计算设备的算力价值很高。现代社会中人一天中使用手机的场景很多,结果就是同等的计算能力,因为在手机上使用的时长更多可以付出更多的溢价。iPhone 出现的时候,算力有制程红利,同样的价格第二年可以买到更强的芯片。有网络宽带红利,3G、4G 的普及让用户介入互联网能够低价的消费信息、产生信息。iPhone 自身的硬件设备又有革新,引入了 gps 定位,电子陀螺仪,电容屏。

而现在的时刻,制程红利已经没有了,更高的算力更高的价格。网络红利也没有了,5G 没有大比例降低单位信息的传输成本。

两块桌面级的 cpu,两块 4k 屏,加上外部摄像头,眼球追踪的传感器,未来价格的下限我感觉也是mac book pro 的售价。如果 VP 最终大众市场价格落在 15000,他并不会进入寻常百姓家。

不是问题的问题

我觉得现在很多人提出的问题都不是主要问题。因为我相信一些问题会随着工程迭代被优化。也许 5 年后才进入成熟期也是有可能的。

佩戴不舒适、重量大。这个肯定会持续优化。而且这个问题我感觉也可以通过一些附件或者特别的使用姿势来优化。说不定未来有个专门的躺椅来配合VR 设备,和机器人总动员里的最后的人类一样。

Image.png

价格贵。这个问题我觉得对苹果来说不重要。iPhone 和 Mac 也不便宜。苹果的产品思路就是维持利润率做价值创新型的产品。算力普惠不是苹果的社会责任。VP 也许最终是一个高端的生产力产品,但是总比一个 lv 的包有意思。

没有 killer App。我觉得这是个因果。有了合适的土壤,自然能生长出好的果实。而且我觉得说有一个神奇 App 愿意让全民花一两万买一个设备有些不切实际了。就拿现在国民级的应用支付宝举例,你觉得大家买手机是为了用支付宝吗?如果这个逻辑成立的话,那阿里就可以出个支付宝专用手机,其他平台app 全下掉,你觉得用户会为这个杀手应用买个新设备吗?会有一部分人对一些特定应用感兴趣,愿意为一些应用买专用的设备,现在的游戏主机就是这样。但是着肯定不是民众级的。

不便携。这个产品定位就是在一个固定场景使用的。也许未来会有更便携的的版本吧。可是我走路的时候也不怎么玩手机,为什么我要带着这个东西移动呢。

作为软件开发者,我看到的 Vision Pro 最大的槽点是居然没有窗口管理。希望下一代的可以解决这个问题吧。

软件开发者视角:新的机会?

我相信随着 VisionOS 的成熟,这个平台会诞生一批原生空间应用。

如果你的目前的应用就是桌面的,移植过来没什么难度。但是为平面设计的应用肯定是发挥不了空间的优势。

有了空间的信息后,必然有一些新的软件使用场景会得到扩展。也会有新的场景。只不过对设计的门槛肯定是提高了一点,以后的 UI 不仅要会做平面的设计,还要会做三维的场景了。

Vision Pro 早期销量不会高,用户以高端价值型为主。如果做产品做一些面向小众专业人士的高价值型的应用机会大一点。因为这些有生产力的人才愿意为生产效率付钱。大众消费类应该还是任重道远。