微软的VR头显算是高端么?这要从两种定位追踪技术说起

Xsens动作捕捉 2023-05-09 2843

微软的VR头显算是高端么?这要从两种定位追踪技术说起  第1张

微软在自家的 Win 大会上曾经嘲笑过现在的 PC 驱动头显不仅价格昂贵,并且“定位技术”落后。不过,但凡体验过 HTC Vive 的用户都会被它的 Room-Scale 技术所折服,感叹自由在虚拟世界里行走的美妙。目前最优秀的 VR 定位追踪技术为何被微软说的如此不堪?其实这要从两者之间的定位追踪技术区别说起。

Vive 的诞生与「Outside-in」

Vive 的定位追踪技术是由 Valve 提供的,就是大家熟悉的 Steam 游戏平台背后的开发运营商。最初 Valve 作为较早看出 VR 背后无限可能的公司之一,早在 2012 年前就做出了定位追踪的技术,不过该技术的体积较大——整个技术的实现是在一个封闭的空间内,由摄像头通过捕捉二维码—— AprilTags 实现。

微软的VR头显算是高端么?这要从两种定位追踪技术说起  第2张

AprilTags

对于这项技术熟悉的读者或许知道,这项技术原本用于 3D 扫描空间,进行 3D 建模使用的,当时 Oculus 也看中了 Valve 开发的这项技术,拉 Valve 一起“共襄 VR 盛举”,然而后来由于 Oculus 的“挖角行为”被 Valve 发现,两者的合作就此打住,不然也许用上 Room-Scale 技术的就是 Oculus Rift 头显了。

后来的事情大家也知道了,HTC 与 Valve 一拍即合,然后就有了现在的 HTC Vive。那么从第一代追踪技术 AprilTags 到第二代追踪技术 Lighthouse,Valve 方面到底改进了些什么?

微软的VR头显算是高端么?这要从两种定位追踪技术说起  第3张

HTC Vive 整套

从本质上而言,Valve 依然奔驰在光学追踪的道路上,不过第一代追踪技术是被动光学追踪:被动光学追踪的技术原理是,有一个固定的摄像头用于扫描被追踪点,在 Valve 的技术里,就是那些 AprilTags。这些二维码中蕴含着一个相对的位置信息,摄像头搜集这些信息之后,比对这些二维码之间的距离参数,根据相应的算法,计算出摄像头的相对位置。第一代技术的缺点在于,在正式工作前,需要准备大量的定位标记,并且这些标记之间必须要有足够的距离。

出于便利性的考虑,Valve 和 HTC 方面联手一起设计了第二代技术——同样是光学追踪技术,这次由被动式变成了主动式。原来是标记点“被动地”告诉摄像头位置,需要设备上的摄像头来寻找;而第二代技术则是由 Lighthouse 基站主动发出激光束,而头盔上布满了大量的传感器用于捕捉这些激光,然后根据不同位置传感器接受光线的时间,计算出头盔在空间内的相对位置。

无论是第一代还是第二代技术,它们采用的都是 Outside-in 的追踪技术,即需要外部信息源的输入,给予头盔位置信息。这一类定位追踪技术虽然需要在实现定位追踪功能上需要辅助定位点或者「灯塔」,但就目前而言其精准度要比其他类型的要高。

HoloLens 「技惊四座」离不开「Inside-out」

最早是在 2015 年 1 月份,微软在其开发者大会上展示的项目,当时由于使用者能通过 HoloLens 与虚拟世界中的物体产生交互,一时成为当时的热点。有一些人甚至怀疑它到底是不是用特效动画做出来的。后来,一部分开发者拿到 HoloLens 到手之后才打消了这个念头。

与 Vive 不同的是,HoloLens 采用的是 Inside-out 的追踪办法,它无需架设额外的辅助识别设备,只需要依靠机器上的摄像头即可。这些摄像头可以进行实时的场景扫描,并在设备里渲染出带有景深的场景。

微软的VR头显算是高端么?这要从两种定位追踪技术说起  第4张

HoloLens

这套技术被称为 SLAM(Simultaneous Localization And Mapping),即同步定位与建图系统。这个技术被用于机器人、无人汽车、无人飞行器的定位与寻路系统,它是计算机视觉(Computer Vision)中的一部分分支。

当设备获取到了现实世界中的实时三维图像之后,然后再通过在半透明的玻璃镜片上进行渲染和显示,与现实世界中的实物合为一体。因此,微软并没有将自己的这套设备归类于 AR 之中,而是自己重新发明出了一个新概念——MR(Mixed Reality)。

MR 能将渲染出的虚拟形象与现实融合,微软的 HoloLens 也确实达到了能使用的效果,但其短板也是显而易见的——凡是体验过 HoloLens 的人都表示其 FOV 很小,大约在 30°-40° 之间(Vive 的 FOV 为 110° 左右),而且当使用者过度靠近现实中的物体之后,HoloLens 就不会渲染出近处的物体。此外,由于整个计算和渲染的设备都戴在头上,其重量和佩戴体验,也不会好到哪儿去。

挡在「Inside-out」前的技术门槛

了解了以上信息之后,我们也不难理解为什么微软会对 HTC Vive 的定位追踪技术嗤之以鼻了——毕竟 Vive 的 Room-Scale 功能需要架设 Lighthouse 定位系统,这一点也是在 Vive 评测中许多媒体所诟病的。

无需架设外部追踪设备不仅仅简化了按照步骤,更重要的是,基于计算机视觉的定位追踪也可以用于识别物体和肢体动作,从而让人们在 VR 世界里拼接直觉进行交互。目前运用 Outside-in 技术的设备都是控制器来进行交互的,采用 Inside-out 的技术,即可使用同一组定位追踪设备对人手势和肢体动作进行识别和追踪——当然这需要计算机视觉的算法达到相当先进的地步。

微软的VR头显算是高端么?这要从两种定位追踪技术说起  第5张

Magic Leap 宣传视频截图

目前 Inside-out 技术囿于精度和延迟的问题,还无法与 Outside-in 相媲美,尤其是在多人大范围的场景下。市面上几乎所有的 VR 主题游乐园采用的都是 Outside-in 原理的技术,原因不仅在于 Inside-out 技术精准度达不到要求,更重要的是,多人交互场景还涉及到大量的计算,仅凭小体积的一体机是达不到要求的,而目前采用 Inside-out 技术的机器都秉承着无线化和轻量化的原则,都没有外接计算设备。

事实上,采用 Inside-out 定位追踪技术的公司不止微软一家,Magic Leap 采用的也是同种技术,基于计算机视觉的定位技术——不过其显示的媒介并不是半透明的玻璃或普通屏幕。

然而,只有微软拿出了较为成熟的产品,Magic Leap 的神秘设备还存在于其实验室中,这一方面固然有光场显示技术难度太高有关,另一面也能从侧面看出 Outside-in 技术要达到可用,确实需要较长的研发周期。但这依然挡不住外界对于这项技术的期待,更有人认为它将成为游戏交互的颠覆者。

真极客有钛度,大开脑洞黑科技

更多精彩关注微信号:钛极客(TiGeek)

The End