体制内的连续创业者 要让动作捕捉成为VR交互的第一形式

Xsens动作捕捉 2023-05-03 3728

VR的核心在于沉浸感,而沉浸感的重点则在于交互。

体制内的连续创业者 要让动作捕捉成为VR交互的第一形式  第1张

智东西 文|晓寒

VR最重要的意义在于其能够为我们创造一个虚拟的奇妙世界,而这种奇妙的感觉除了需要依靠视觉来感受之外,还需要与虚拟世界的交互。眼下,代表VR技术顶峰的三大头显HTC Vive、PS VR以及Oculus Rift在交互领域走的都是手柄方案,虽然三家的手柄方案在流畅度以及功能性上等做的不错,但是手柄交互的方式也仍然面临着只能模拟手部以及并不“真实”的问题。

正是基于这种背景,在许多VR创业公司都专注在头显、内容或是全景直播等方向的时候,VR交互领域也出现了一批想要吃螃蟹的人,广州幻境科技的CEO陈曦就属于其中的一个。

体制内的连续创业者 要让动作捕捉成为VR交互的第一形式  第2张

陈曦之前曾在政府、研究机构等单位从事技术研发与管理工作,自2009年起就一直与多位好友在利用业余时间研究手势与动作识别技术,并逐渐对这个领域产生了深厚的感情。2016年初,仍怀有创业梦想的他毅然决定放弃自己在体制内的成绩与经历,和几个伙伴一起创办了广州幻境科技,并推出了一套基于IMU惯性传感器方案的全身动作捕捉方案。目前,幻境科技先后与从事VR线下体验店业务的广州玖的、上海米粒影业、联络互动达成了战略合作。

本期智东西·硬创先锋走进幻境科技,带您聚焦幻境科技CEO陈曦,一探其背后的创业故事与发展路径。

· · ·

创业起因:让聋哑人发“声”

2009年夏天的广州依然骄阳似火,准备外出的陈曦在下楼时碰到了一位邻居,随口问了句:“大热天的,您这是要去哪儿呀?”,结果对方并没有说话,而是笑了一下指了指自己的耳朵——聋人。一时间,尴尬的氛围迅速充斥着楼道,而陈曦却也只能是看着邻居转身进门而不知该如何结束这场对话。

那时候仍在政府机关从事电子信息行业管理的陈曦有几名同样喜欢钻研技术的好友,他们经常在业余时间里探讨技术并希望能够做出一些新东西出来。在他们举行的一次小组讨论中,陈曦提到了自己与聋人邻居的经历,提议做一款手语翻译手套,这款手套可以通过滤波算法来识别手语,进而再通过手机等移动设备来帮助聋哑人重新发声。

体制内的连续创业者 要让动作捕捉成为VR交互的第一形式  第3张

这个想法得到了大家的赞同,在评估了团队的能力储备之后,他们还进行了详尽的市场调研。在调研中,陈曦发现在2010年时中国的聋哑人数就达到了2054万,翻译手套是一个市场潜力巨大的领域。于是陈曦等人马上行动起来,“一个人负责嵌入式硬件和软件,一个人负责上层OPEN GL研发,我和另外一位伙伴负责代码的实现和印证。”陈曦回忆道。

半年后,第一个样品手套就这样被四个大男人一针一线的缝了出来,但是由于当时采用的IMU传感器只含有一个三轴加速计,且其采样精度和灵敏度存在局限。

随后,团队又将IMAGE的flex弯曲传感器引入到方案之中,即通过弯曲传感器来检测手指的弯曲动作,而三轴加速计则被用来检测手掌的翻转。但是在完成二代产品的研发之后,新的问题又出现了,即现在的方案仅能测量围绕着某个中心点的手部动作,而手语体系中却又包含着许多空间移动的动作,这样手语手套的翻译能力受到了很大的限制,其手语动作识别率仍然只有60%左右。

体制内的连续创业者 要让动作捕捉成为VR交互的第一形式  第4张

当时的陈曦觉得非常挫败,甚至开始怀疑自己的选择。与此同时,团队中的两名成员也由于自己的发展问题先后离开了广州,手语手套的项目就此搁置。

2013年初,陈曦得知InvenSense已经于2012年5月推出了六轴IMU模块(即三轴加速计加上三轴陀螺仪),新的IMU模块能够对两个传感器的数据进行相互验证,在提升采样精度的同时也能够检测到物体的空间移动动作了。

陈曦看到了新的希望,他与分散在各地的成员一起,又推出了基于六轴IMU模块与弯曲传感器的第三代手套,而其手语动作的识别率也上升到了80%。于是,陈曦跟一名成员带着手套参加了2013年5月的深圳文博会。

据陈曦介绍,在文博会上,时任中宣部部长的刘奇葆和前中共中央政治局常委张德江还专门来到了他们的展台了解手语手套,且现场也有人直接想要将产品买走。这给了陈曦及团队极大的鼓舞,他们下定决心要坚持着将手语手套做下去。

· · ·

转型:从手语手套到VR动捕

当手语手套的动作识别率上去之后,陈曦他们认为这个手套的应用范围会更加广阔。他们首先想到了游戏,而当时又恰逢上海第四届中国游戏百人会即将开幕。于是,陈曦他们花了两个月的时间开发了一款基于手部动作的第一人称射击游戏,去了上海。

在这届游戏百人会上,陈曦团队在展示游戏方案的同时,也不忘将其手语翻译方案拿出来进行宣传,但是却鲜有人问津,大多数人都跑去玩游戏了。“其实都是一样的技术,只不过是换了个应应用场景。”两款产品在游戏百人会上受到的不同待遇让陈曦隐约地觉得团队的发展方向有些问题。

2014年,陈曦他们进而又马上推出了基于九轴IMU模块与弯曲传感器的第四代手套,可以识别超过280个手语,并且成功率也达到了95%的高水平。再配合着团队此前为安卓手机开发的APP,聋人用户带上手套进行手语动作的时候,手机就能直接将动作转换成语音,陈曦团队的手语手套在技术路径上获得了成功实现。得益于第四代手语手套的成功,陈曦他们根据第四代手语手套方案的成功经验,又进一步推出了基于九轴IMU模块的全身动捕方案。

体制内的连续创业者 要让动作捕捉成为VR交互的第一形式  第5张

于是,早已过了而立之年的他在那一刻觉得不能再辜负梦想了,他决定要真刀真枪的干!随后,经过一段时间的沟通,他成功 “忽悠”其他成员辞职创业。

2016年初,陈曦团队拿到了广州动捕恒准的400万元天使投资,注册成立了广州幻境科技有限公司,并将公司的发展方向从手语手套转移到了VR动捕领域。在陈曦看来,不管是手语识别,还是VR动捕,其原理与技术都是一样的,只不过应用平台发生了变化。

为此,陈曦还专门引入了一个Unity团队,为他们的动捕方案开发配套的VR内容。2016年4月,幻境团队完成了第一个VR交互体验场景——天宫一号虚拟体验。这是一个模仿天宫一号航天器的场景,用户带上VR动捕套装,配合着HTC Vive头显,能够与场景中的宇航员互动,包括拥抱、握手等动作,并能进行失重实验、水滴实验等。

体制内的连续创业者 要让动作捕捉成为VR交互的第一形式  第6张

· · ·

VR动捕:光学与传感器之争

提到动作捕捉, 光学方案与IMU惯性传感器方案的对比是一个绕不开的话题,智东西与陈曦就两种方案的优缺点进行了深入探讨。

光学方案的核心是一个布满高性能摄像头的阵列,然后让动作人穿上布满光标的衣服,进而通过摄像头捕动人体动作。但是这种使用摄像头阵列的方案过于昂贵,所以一般都是由财大气粗的电影公司在使用。

体制内的连续创业者 要让动作捕捉成为VR交互的第一形式  第7张

而应用于VR领域的光学动捕方案则多是通过像是英特尔的RealSense这类深度摄像头来实现的,例如Usens淩感的Fingo方案,Leap Motion的方案等等,具体的应用案例则包括英特尔自家的Alloy、搭载Usens淩感的交互模块的移动VR产品、以及搭载Leap Motion模块的暴风魔镜5 Plus等等。

体制内的连续创业者 要让动作捕捉成为VR交互的第一形式  第8张

另外,在很多这些厂商使用双目深度摄像头的同时,也存在像是北京英梅吉的Hand CV类的单目摄像头方案,单目方案虽然更适合一些轻量级、小幅度的动作,但是其单目的优势则在于不需要额外的硬件,仅仅通过手机上的摄像头就能实现。

幻境科技的交互产品则是基于IMU传感器的方案。IMU就是Inertial measurement unit惯性测量单元的意思,一般由三轴加速度计、三轴陀螺仪、三轴磁力计三个内核构成,三个内核加起来被称为九轴,而如果只有一个或者两个内核,则被称为三轴或是六轴IMU。

从上述介绍可以看出,基于深度摄像头或是单目摄像头的光学方案的优点就是不需要用户穿上额外的设备即可设别用户的动作,并且双目深度摄像头还能实现SLAM空间定位方案,可谓一举两得。

但是其也有缺点,首先就是摄像头模块一般都是假设在头显或者是装在头显的手机里面的,所以其只能识别用户放置在摄像头前面的双手的动作,而当双手放下或是在摄像头的视野之外做动作的时候,是无法识别的。除非是像微软Kinect那样,将摄像头放置能够扫描到用户全身的位置,才能识别用户全身的动作。

其次是摄像头对于光线的依赖非常严重,如果用户的使用环境过亮或是过暗或是背景过于杂乱,摄像头方案就会被严重干扰。进而产生识别延迟、无法识别等问题。包括英特尔在今年的IDF上展示的Alloy一样,其虽然很方便,但是在动作识别方面,还是会有延迟。

体制内的连续创业者 要让动作捕捉成为VR交互的第一形式  第9张

而基于IMU传感器的惯性方案则能够解决摄像头的上述缺点,例如不受环境的影响、能够追踪全身的动作、延迟低、精度高等等,并且还能够跟其他反馈功能如力反馈、温度反馈、电信号反馈相结合等等。

但是其缺点也非常明显,首先就是需要在用户身上穿上一系列传感器,特别是需要捕捉全身动作的时候,用户需要在身上绑上多达十几个传感器模块才使用。其次,传感器方案对绝对空间位置,不能进行标定,需要得到其他技术方案的支持。最后则是其误差问题,由于IMU模块内部三个传感器的先天特性,其在长时间使用后会有累计误差,即俗称的漂移问题,需要通过算法或其他办法进行修正补偿。

所以,基于现在的情况来看,陈曦认为光学方案与IMU惯性方案在目前上不存在谁取代谁的问题,两者会长期共存,“但未来基于消费级的VR交互设备和产品,必然是惯性动捕方案为主的。”陈曦说道,“因为穿戴才是真正的便携,而架设像是Lighting House那样的光学设备才是真的繁琐。”

· · ·

结语:交互是VR最重要的一环

目前,幻境的VR动捕手套、VR全身动捕套装的开发工作已经步入尾声,即将进入工厂试制阶段。虽然其产品的最终价格还尚未明确,但陈曦表示其目前的物料成本大概在两千到三千元之间,“随后实现批量采购后,物料成本能够大幅下降。幻境科技会尽可能的提供让大家用的爽且消费的起的产品。”

据其介绍,可穿戴类的VR动捕方案除了具有延迟低、精度高、不受环境限制等优点之外,还有一个天然的优势,就是能够与各类反馈功能相结合。具体来说就是因为其需要用户穿上相应的设备,所以可以将IMU传感器与带有力反馈、温度反馈甚至是电信号反馈的特制服装相结合,让用户在VR世界中既能用自然动作输入,也能获得相应的感应输出。

“VR的核心在于沉浸,而沉浸的重点则在于交互”关于VR动捕在行业中的地位,陈曦这样说道,“幻境科技的理想就是做有情感的VR交互!”

通过幻境科技的例子,让我们看到了在VR创业中的另外一个思路,即避开拥挤的头显、游戏或影视领域,通过为VR产业提供真正用的上的辅助技术来寻找发展机会。而这种思路,在眼下资本收紧、行业风口依然没有打开的情况下,确实具有借鉴意义。

硬创先锋

智东西旗下的品牌栏目,专注挖掘全球最具潜力的智能行业创业项目。

报道勾搭微信:zhidx_com

智东西招新

在这里与下一个BAT创造者交朋友!

五大智能领域记者/编辑/实习生

欢迎自荐/推荐,简历至HR@zhidx.com

The End