中国的Vision Pro来了,盯上了你的电脑
互联网| 2023-08-26 19:59:05

美编 | 邱添 审核 | 颂文

九年磨一剑,Rokid交出了漂亮的答卷。采用分体式设计,让鼻梁上的AR眼镜只多1克,甚至比同行的消费级眼镜还轻,但交互和显示是全方位的跨域,进入AR空间计算时代。


(资料图片)

1

把信息“吸”过来又“丢”出去?人和信息的对话不再需要介质

大拇指和食指轻轻一碰,空间交互的大门即被打开。里面有个人在互联网世界游走多年熟悉也不愿轻易改变的一切:微信、b站、浏览器等。只是它们显示的界面从方寸固定的电脑和手机屏幕变成了无所不在的空间。

每一寸空间都可以成为显示屏幕,你可以同时并列打开4-5个浏览窗口,每一个都是大屏。还可以把其中一个屏幕设置成巨屏模式。想象一下,你的电脑桌面变成了影院里的巨幕,这是何等的办公体验?

在兼容过去生态的过程中,Rokid也赋予了产品全新的交互体验。比如,在传统搜索场景下,原本的信息展示都是瀑布流布局,手指和鼠标不断往下滑,信息会不断刷新,选择其中一个点击,打开一个新窗口。

而在Rokid的空间搜索模式中,当你选择文本或者语音输入一句话,所有相关的信息会“飞”入眼帘,立体排列的各种信息扑面而来,点开其中一个链接,其他信息会根据你的兴趣智能化重新排布。

它打破了信息传递的方式:人和信息的交互,不再需要实体屏幕,人和信息可以直接“沟通”。

这是信息搜索的一种前所未有的体验。从浏览器信息的搜索到短视频流的数据推荐机制,都将因为AI+AR的融入而酝酿新的变革。

此外,这个空间里也有大众期待已久的全新生态体验:篮球和篮框都漂浮在空中,你可以用手掌把篮球“吸”过来,然后把它“丢”到篮框里;大拇指和食指再轻轻一碰,你的办公室可以秒变游戏场,空中弥漫着怪兽,你前进后退,合并双指不断点击。

点击得有多快,极限走位有多灵活,就决定了你得分能有多高。你还能闭上眼睛,根据声音的方位判断怪兽在哪个位置。

Rokid小心翼翼地烹饪着空间计算这道小鲜,调和着新旧的生态比例,让用户能有新奇感又不至于有完全的陌生感,没有一丝设计是多余的。

这个空间套装名叫Rokid AR Studio。延续Rokid分体式设计思路,由AR空间计算眼镜Rokid Max Pro和AR空间计算主机Rokid Station Pro组成。

2

1克的变化,承载一个时代的跨越

难以想象,这所有的变化,只是让用户戴在鼻梁上的眼镜重了1克。

这1克的变化也意味着,AR眼镜可以做到大众所期待的轻薄、可穿戴形态,但是具备酷炫的3D交互和全新的应用。也意味着,AR行业的进化,不再是以眼镜进化为唯一标准,而是进入软件系统和生态建设的第二阶段。

2021年,Rokid在AR行业率先提出了分体设计。打造了AR行业首款主机Station,引入云计算为AR开辟道路,让显示与计算分离。在重量、算力和续航矛盾之间找到了软解法。这个分体设计在这一次的空间计算套装上发挥到了极致:

眼镜承担感知和显示功能,算力搭载在独立的主机上。为了让Station Pro足够强大,Rokid为其选用了一颗高通的专用芯片XR2+Gen 1。相较于骁龙XR2平台,可以带来30%的散热性能提升和50%的持续性能提升。

Station Pro脱离了手机的制擘,通过定制化的主动散热与性能均衡机制设计,可以持久保持高频高性能输出、高速计算的同时,给用户带来90Hz刷新率下极致低延迟的AR体验;得益于定制化的大容量电池,续航能力是手机型AR主机方案的2倍以上。可以担负起丝滑的双手空间实时交互体验,也可以承载应运而生的空间计算生态。

而要支撑起这一整套空间交互的背后,是其操作系统。

好的操作系统一定是软硬件高度配合和协同。为了实现最好的AR体验,Rokid产品一直都是跑在自研的操作系统YodaOS-Master上,并在每个细节都进行重新定义和深度调优。

空间计算有两个核心算法:SLAM和裸手手势。一个用来精准感知物理空间,一个用来和虚拟内容交互。通过优化算法和XR2+的硬件加速,Rokid基于单目摄像头的空间定位和交互体验达到了业界领先水平。

上接用户,下接硬件,中间还要桥接开发者,Rokid操作系统为开发者构建空间内容提供了丰富的开发套件。开发者可以基于手势做出丰富多彩的互动应用。

这是一场新的战争,不仅是软件的战争,也是生态阵营的战争。一边是以苹果为代表的iOS生态,一边是安卓的AR开放生态。

3

AR进入软件系统和生态建设第二阶段,Rokid 9年磨一剑成为名副其实的AR领航员

对于VST方向的硬件来说,400克以上的自重,还没有很卷;但对于OST方向的硬件来说,眼镜只有几十克,每增加1克,可能都要做平衡考虑;而每减少1克,都是一个技术攻坚了。

AR眼镜每一克的变化,都蕴含了无限的功力。

2013年,谷歌推出了世界上第一款AR眼镜。Rokid CEO 祝铭明,大家通常叫他Misa,第一次戴上谷歌眼镜时在朋友圈记录下了他的两个感受:1、非常棒的创新;2、我们可以做得更好。也正是这时候萌生了离开阿里创业的想法。

他万万没想到,这个启蒙他的科技巨头,在10年后成了盟友,Rokid Station搭载谷歌安卓电视生态,一起赋能全球AR生态;更令他没想到的是,他从小当成偶像的乔布斯的苹果公司,也在10年后经过严苛的审核流程,将Rokid Max陈列在了专卖店中,成为内地第一个进驻苹果专卖店的AR眼镜。

今天,Misa用1克来诠释了他的创新,十年的AI和人工智能技术的积淀也发挥得如火纯青。

在产品和技术路线选择上,坚持用更少的摄像头结合大量的AI技术来实现AR的空间计算能力。我们知道摄像头在将世界三维信息投影在二维的CMOS上,会损失一个维度的深度信息,为了还原真实的深度信息,Rokid死磕技术难题。

为了解决业界单摄像头3D手势识别精度不够高的问题,Rokid采集和标注了数百万手势样本训练数据集,经过大量的AI训练,充分发挥XR2+的硬件加速能力,最后达到了厘米级的识别精度、厘米级虚实手贴合精度和10ms极低单帧跟踪耗时体验。

2013年,AR还并不成熟,Misa选择更容易被产品化的AI能力入手,推出陪伴型AI智能音箱产品;并在2018年找准时机,用AI+AR的组合拳切入了AR眼镜产品。

自此以后,从测温、工业、制造、汽车到文博文旅、消费级,路越走越宽,产品形态也越来越多样化;从中国到全球,Rokid不断在每个国家插上旗帜。

从语音交互、图形计算,AI的基因一直融入在Rokid的技术命脉中,但鲜为外人道。因为对于Misa来说,无论是AI还是AR,科技都是被人文主义“关”起来的。科技的创新是为了帮助人们更好地体验和享受科技:在博物馆为100多万人讲述“活着”的历史;在边远山区和海岛为10余万当地人提供急救医疗辅助……

在看不见的地方,Rokid已引领行业深深扎根。

4

是苹果or中国

苹果在今年6月给出了它的空间计算;8月,来自中国杭州的创业公司Rokid是一个响应,并给出自己答案的公司。是头盔形态的VST还是眼镜形态的OST?是开放生态还是封闭生态?国际巨头还是中国新兴的创新力量?

现在,大家在同一起跑线。

@投稿专线 微信:cyzqx2013

END

▼往期精彩回顾▼

在看点这里

财经
资讯
精彩新闻