XR技术作为全球瞩目的新兴领域,近期吸引了福布斯专栏作家、CJPA全球顾问公司创始人兼首席执行官、纽约大学SPS兼职讲师厄尔·卡尔的深度剖析,特别聚焦于中国AR产业的蓬勃发展。
他在文章中暗示,XR技术极有可能引领下一轮屏幕革命,成为在电视、个人电脑及智能手机之后的“第四块屏幕”。
福布斯对比了国内外企业在AR/VR赛道的不同战略取向:欧美企业倾向于采用VST技术,同时深耕商业应用领域,致力于提高技术精度与专业性,哪怕牺牲一定的佩戴舒适度和价格,通常它们的产品定价高于1000美元,不利于普通消费者接纳;而中国公司,则更加侧重于消费者市场的开拓,以提升用户体验为核心,推出了一系列面向大众的创新产品,Rokid新近发布的AR Lite就是典型例证。
Rokid等国内企业正致力于将AR眼镜普及至更广泛的消费者群体,它们的产品更为轻便,仅有70多克。戴上眼镜后,即能享受沉浸式的游戏和观影体验,还能让用户得心应手地处理工作文档,实现了娱乐与生产力的双重提升,为消费者市场带来了全新的可能性。
以下是福布斯《AR/VR市场竞争:中国企业的抉择? 》报道原文:
在《绝命毒师》首集中,汉克和他的同事们讨论毒贩藏身处的外墙颜色,汉克称之为绿色,但他的同伴纠正说是鼠尾草绿。2015年,一条裙子在全球引发了颜色争议,这条裙子实际上是黑色和蓝色,但由于照片的光线角度、曝光和白平衡设置,许多人误认为它是白色和金色。这场争论最终演变成了一种全球性的病毒式现象。
每个人对世界的感知可能是独一无二的,受到过去经历、教育背景和职业经历的影响。此外,感官敏感度的遗传差异也在发挥作用。在现代社会,显示器、传感器、算法和软件同样能影响个体信息的接收方式。技术使人们越来越模糊现实与物理世界的界限,就像在电影和游戏中追求的沉浸式体验一样。
过去十年,继电视、个人电脑和智能手机之后的“第四块屏幕”一直是业界热议的话题。“下一个iPhone”成为反复被提及的问题,而增强现实/虚拟现实(AR/VR)或许就是答案之一。然而,据IDC数据显示,2023年对AR和VR行业来说并非顺遂之年,全球头戴设备的出货量下降了23.5%。但预计2024年将迎来复苏,出货量有望激增44.2%,这得益于全球经济的回暖及苹果Vision Pro所激发的热情。与此同时,以Rokid和XREAL为代表的中国制造商正通过推出成本更低的产品扩大市场份额。
以往,不同产品类别的涌现部分归因于对未来需求理解的不足及行业标准的缺失。例如,微软使用“混合现实”这一术语来区分其产品。虚拟现实(VR)被定义为完全隔绝现实世界,而增强现实(AR)则是在真实物体上叠加文字或图像。体验上的这一区分至关重要,因为VR可能导致幽闭恐惧症,而AR则不会。此外,VR技术更为复杂,因为它力求彻底屏蔽现实世界。
尽管AR与VR看似迥异,但行业最终的目标都是实现科幻小说中描绘的场景——创造出便携式设备,使虚拟现实尽可能贴近真实,广泛应用于工业生产与日常生活中。
OST VS VST
然而,在追寻这一宏大目标的过程中,不同公司之间存在着显著差异。美国的巨头企业如苹果和Meta几乎拥有无限的资金与研发能力,使它们更接近理想的VR状态。具体而言,它们采取不同的方式,让用户通过眼镜或头戴设备感知外部世界。从技术层面看,用户通过眼镜或头戴产品观察世界有两种方式:视频透视(VST)—通过摄像头捕捉外部世界,再投影到头显或屏幕显示上;光学透视(OST)—在光学镜片上展示虚拟对象,使用户能直接透过镜片看到现实世界的物体。由于两者都以数字图像形式提供信息,VST能够像素级地混合实像、虚像或二者兼具,模拟出比OST更逼真的遮挡效果。换言之,如果我通过OST设备看到一个杯子,但无法完全消除它,VST技术则能做到这一点,这进一步拓宽了其应用前景。
上述内容仅是光学透视(OST)与视频透视(VST)众多差异中的一个方面。总体而言,VST是一个技术挑战性更高的发展方向。为了实现对外部世界的完美模拟,苹果的Vision Pro采用了12个摄像头、5个传感器以及全新的R1芯片。相比之下,OST则是一种相对简单且原始的解决方案。该方案的优点在于,我们能够直接通过肉眼观察外部环境,这是一种绝对真实的、高清晰度且无延迟的体验,无需过多用于图像重建的硬件。因此,这类设备通常更为轻便,常以眼镜的形式存在,大约重70克,而不是重达600克的头戴设备。
与大型品牌近乎无限的研发资金和能力相比,中国新兴品牌正在尝试单目同步定位与建图(SLAM)技术。该技术的优势在于降低了成本、体积和功耗。然而,由于硬件结构较为简单,就需要通过复杂的算法来进行弥补。当前,相较于多摄像头解决方案,单目SLAM算法在精确度和理想效果上还未取得特别显著的成果。由于单目SLAM不能像双目或多目系统那样根据视角计算深度信息,而必须依靠前后帧捕获的算法来计算深度,所以在一定程度上,单目SLAM的定位精度仍然落后于双目解决方案。不过,行业内领先品牌如Rokid所达成的精度,已能达到厘米级的高准确度。
ToB商业市场 VS ToC消费者市场
并非所有美国大型企业都选择了完全符合VR理想状态的道路(这里指的是虚拟画面感极强,让人感觉身处其它世界)。例如,微软的HoloLens采用的就是视频透视(VST)解决方案(用VR技术呈现现实世界)。微软与中国企业之间的区别,在于它们各自瞄准的市场——面向工业商业应用与面向消费者市场。
起初,HoloLens的设计意图是同时服务于企业和消费者市场,这反映了其开发团队源自Xbox项目和消费者娱乐领域的背景。微软的首席开发者Alex Kipman解释了HoloLens为何还不适合消费者市场:其沉浸感和舒适度不足,且价格需要降至1000美元以下。因此,HoloLens被定位为企业级设备,在建筑、医疗、教育、汽车等多个行业中得到应用。
Rokid的战略与微软相似,其创始人&CEO祝铭明表示,他们的目标是将AR眼镜普及到大众消费市场。然而,中国企业并未优先考虑在美国推出商用产品。中美之间在资金、科研资源可获取性以及商业模式上的差异对此有所影响。美国的商用设备往往为了追求更高精度而牺牲舒适度,特别是在工业制造领域,而消费者则更重视游戏和观看体验。此外,中国高科技企业进入美国商用领域可能会面临严格的监管,尤其是在TikTok事件之后,这一情况尤为明显。
独立生态 VS 强连接性
除了中美企业间的竞争,中国国内企业间也存在着不同的发展方向。
Rokid与XREAL作为中国在全球范围内最具竞争力的AR眼镜品牌,均采用了OST技术来研发AR眼镜。这两家公司的创始人来自阿里巴巴和英伟达,带来了丰富的算法开发经验。
XREAL早早就将目标锁定国际市场,但遭遇了一些挫折,包括与Epic Games的Unreal引擎发生商标纠纷,这推迟了其进入美国市场的步伐。尽管如此,XREAL意识到了专注产品研发的重要性。2022年,公司被福布斯中国评为崛起中的独角兽,估值超过15亿美元。在2024年的CES上,XREAL宣布与高通和宝马合作,瞄准空间计算应用领域。目前,XREAL在美国亚马逊的智能眼镜销售排名中位列第二。
Rokid则在2022年7月进入北美市场,并在黑色星期五期间成为智能眼镜和视频显示眼镜类别中的畅销品牌。尽管Rokid与XREAL互为竞争对手,但它们似乎走上了不同的路径。2023年,Rokid发布了消费级的OST个人空间计算平台——Rokid AR Studio,标志着中国公司首次推出了空间计算平台,它包括Rokid Max Pro眼镜和Rokid Station Pro主机。不同于其他厂商强调设备的互联性,Rokid专注于无需外部控制器的空间交互计算。
Rokid还发布了YodaOS-Master操作系统,并建立了新的开发者标准,旨在简化开发流程并加强安全性。这一创新标志着中国品牌首次尝试构建自己的AR生态系统,此前这一成就被认为只有苹果这样的巨头才能达成。Rokid在这一领域迈出了重要的一步。
尾声
AR/VR行业的竞争仍然激烈。诸如路线选择是走OST还是VST的、产品定位是面向商业还是消费者市场,都是至关重要的决策,反映了每家公司的眼光和优先级。
Rokid通过推出YodaOS-Master操作系统及开发者标准,构建独立AR生态系统的做法,展示了一次提升用户体验的勇敢尝试。这与XREAL增强设备互联性,以提供多样使用场景的战略形成对比。两种策略各有千秋,哪一种能更受用户和开发者的青睐,仍有待观察。