如何选购动作捕捉系统Motion Capture?

Xsens动作捕捉 2023-05-09 6099

我们在采购电子产品之前会考虑几个问题:预算,使用对象,外观,性能,价格等。动作捕捉也是一样的,如果您是一位正在诸多动捕产品之间摇摆不定的人,那么可以好好看一下,如何去选择适合自己当下需要的动作捕捉设备。

如何选购动作捕捉系统Motion Capture?  第1张

基于对于动作捕捉产品的分类和形态,我们可以初步开始筛选需要的动捕设备,由于动作捕捉设备本身是比较小众的领域,所以笔者看来动捕设备目前全世界只有大概四个级别的产品线:

  1. 局部捕捉的轻量级产品
  2. 全身捕捉的入门级产品
  3. 多人捕捉的开发者级产品
  4. 多人混合捕捉的专业级产品

局部捕捉的轻量级产品

产品价格:这一类部分的价格大多在2W以下,大多以手部捕捉、或者面部捕捉为主,全身动作捕捉带手指并且价格在2W以下的,应该仅有Noitom的某款设备例外,避免广告嫌疑,感兴趣的同学可以自己去搜索。

适用对象:想做毕业设计的本科生、想做科普教育的K12儿童、对黑科技感兴趣的爱好者、做硬件集成的设备厂商等等。这一类设备常见的形态如下:

光学捕捉(多为手部捕捉和面部捕捉)

利用计算机视觉技术识别手部姿态的捕捉设备,成本从几百到几千不等,一般不超过5K。代表性产品像LeapMotion、Kinect、使用苹果的ARKit打包的面部捕捉产品等,这种技术的特点:

  1. 形态一般是多目相机
  2. 价格很低
  3. 体积小,便携
  4. 可直连电脑或者集成到第三方设备比如VR头盔、商场的那种互动镜设备等
  5. 距离限制较为严重,无法进行长距捕捉(一般为1M左右)
  6. 场地耐受力差,容易受到各种因素的干扰(遮挡,衣服和背景颜色等等)

惯性捕捉(多为手部)

利用惯性传感器来对手部姿态进行还原的设备,这里我将光学为捕捉,而惯性我则更愿意将它称为还原。这是因为光学捕捉是一个对真实的采集对象识别和标定的过程,而惯性则是针对采集硬件本身的变化获取数据和分析的过程。

这一类虽然同为局部捕捉,但是精度上来说,要比光学的手势捕捉效果好上不少,毕竟光学相机很难处理因为遮挡产生的误差和丢帧问题,而惯性设备则没有这个缺陷,所以目前来说,光学系统大多用的第三方厂商的惯性捕捉手套等设备。但目前来说,惯性设备对手部姿态的还原也存在一定的技术瓶颈:

  1. 传感器的固定,手部的传感器固定不像全身那么容易,每个人的手指长度等都是不同的
  2. 穿戴设备要求一定的舒适度,否则手本身的动作变形,捕捉的意义就大大降低
  3. 市面上的大多设备,只捕捉手指的弯曲,而不捕捉手指的舒展,因为对于开发需求来说,手部捕捉的舒展要求较少,另外也不好还原。

所以,如果是作为轻量级娱乐相关的开发设备,我们可以选择光学的手部捕捉,但是如果是对于影视、游戏CG等需要较精确的数据需求,并且可能需要搭配第三方设备进行空间定位的,我们更推荐惯性。

外骨骼捕捉(多为手部)

这一类捕捉是通过外部的机械旋转设备来检测手部各个关节的旋转角度,虽然在网上有很多信息表示这种外骨骼模式的精度高于惯性动捕,但是根据目前笔者的实际使用体验来说,和惯性动捕应该是不相上下的,而且这种设备外观看起来特别酷,就像蜘蛛侠里面的蛛腿。

单人全身惯性捕捉的入门级产品

产品价格:基本在1W到3W之间

适用对象:更多运用于学术研究尝试、VTuber新手、创意设计等对数据精度追求较低的团队

可选的厂家特别少,国际知名度较高的动作捕捉团队中只有Noitom有这个价位的设备。这样的设备可以作为学习和入门的工具,做一下创意系的内容,不适合用来作为生产力工具:比如动画录制,影视后期等,动画师的工作量基本都超过纯手工的工作量了。但是对于个体户来说,去做一些简单的作品还是不错的,毕竟动作捕捉作为一种比较有意思的创造工具也不仅仅是能用于数媒,像很多舞台特效也经常使用动作捕捉来呈现一些艺术效果,虽然入门级别设备相比专业设备表现不佳,但是用于学校的联欢晚会、比赛、或者演示之类的场合还是可以接受的,毕竟成本可控。

多人捕捉的开发者级产品

价格区间:4W-10W不等,属于价格中等的动作捕捉设备。到了这一层,虽然还不算比较顶级的专业设备,但是价格已经开始给一些小团队予以压力了,开发者级别的评定标准,个人觉得是:

1、数据产出可以作为科研依据、体测和康复状态佐证、可以供开发者精简工作流(动画、CG、游戏引擎等),加快工作效率。

2、设备能够提供三个或者超过三个人的同场使用

3、设备相对便携,虽然不像轻量级这样,可以揣兜里或者书包带走,但是基本也可以用一个12-24左右的行李箱搞定

4、设备对于环境有一定的耐受力,场地的使用环境要求降低

5、设备可提供大于中型光学环境空间的捕捉范围(>50M∧2)

适合对象:高校普通级别的研究实验室(数媒、计算机专业、人机工效、虚拟现实等领域),美术团队标准化工作流(一定数量级的素材产出、录制、后期处理等),体育分析和训练(数据质量有一定要求,但对运动员束缚要求较低,例如赛艇、击剑、棒球等),机器人驱动等领域

惯性捕捉设备

顾名思义,和惯性动作捕捉手套一样,惯性动作捕捉设备是基于惯性传感器进行姿态还原的动捕设备,一般是15-21个惯性传感器组成(不包含手指)。目前惯性设备大多是衣服式或者绑带式

如何选购动作捕捉系统Motion Capture?  第2张

衣服式的设备贴合比较紧,传感器相对更稳定点,绑带式的设备对身体束缚较小,所以目前这两种穿戴是目前主流的动作捕捉设备的穿戴形式。

超低频微波手势捕捉设备

利用超低频微波创造一个肉眼看不到的 “场”,由于人体对“场”是存在一定干扰的,因此当手指在场中移动的时候,设备可以通过场受到的干扰进行数据分析,并通过算法得到手在空间的运动轨迹,这种技术更多用在车载手势控制雷达等领域

多人混合捕捉的专业级产品

价格区间:专业级的纯惯性设备基本在20W+/套,光学设备基本在40W+,比较新的光混(可用光,也可拆成纯惯用的专业方案)价格未知,并且这是基础价格,不包含特殊定制或者方案包装。

使用对象:毕竟是用来做正儿八经的项目产出的,要求自然更高,例如漫威的各种大作,美剧中的经典《权力的游戏》等有使用专业级产品进行拍摄辅助,《权游》可是按照电影的预算来拍摄电视剧的,自然不会允许瑕疵的存在。里面的经典画面:荆棘女王和詹姆对大麻雀逼宫的时候,背景里面兰斯特洛城的无数群众,就是用动作捕捉去还原的真实动作,以达到影片拍摄的严谨性。

所以,毋庸置疑,这个级别的产品多用于完美、腾讯这类大厂,或者每年收益盆满钵满的中大型团队,并且抛开设备本身而言,这种级别的团队通常还会加入定制化方案,那价格就相对会浮动更大。

专业级惯性动作捕捉

没错,还是惯性动捕,这个可以把产品线分割到四个级别的技术。但是到了专业级的惯性设备,会和入门级或者开发者级别有什么不同,这里跟大家做个分享

1.是超乎寻常设备的捕捉场景,可以适应各种像特技动作、爬楼、格斗、多人等场景

2.同一电脑可以容纳更多人同场,以及同时适配设备的数量

光学动作捕捉

光学的动捕技术分类目前比较高端的有红外和激光两种,由于相机捕捉的特性,获取到的位置是实时的真实世界的精确位置信息。所以和惯性动作捕捉相比,光学动作捕捉:

  1. 拥有更高的实时性和刷新率
  2. 对质端可以做更好的处理(质端就是手脚等肢体末端,惯性动捕的姿态信息是算法还原出来的,因此肢体末端不能完全在空间上匹配上,但是光学是对空间位置进行坐标重构和获取,所以得到的是精准的空间信息)
  3. 更昂贵的价格(没错,光学的价格跟惯性基本是两个Level,所以基本上没有个几十上百万预算的可以先退场了,基本上低于50W的光学场地数据质量提升比较有限)

光学场地的使用门槛相对较高,对于场地的调试和安装也非常复杂,但是一般这些都由厂商来进行搞定,但是若是你想经常移动位置的话,就另外说了。

光惯混合动作捕捉

最后就是比较新的技术光惯混合了,目前笔者也仅在某公司的内部体验会上尝试了一次,可以将我的认识分享给大家,由于这块产品尚未在国内上市,因此价格尚未公开,有需要的朋友可以小窗,我把相关人员对接给你们自己去PY交易。

光学和惯性作为两种主流的动捕方式,经常被用在同一项目的不同应用上,以弥补各自不同的使用场景和需求。而随着这种使用,逐渐地衍生出了更多的问题。例如光学和惯性来自于不同的厂商,对于第三方自主适配的技术门槛较高,设备的学习成本难以承担等障碍。

但是随着虚拟现实技术被《国家信息化发展战略纲要》列为战略性前沿技术,中国在这方面的产业生态已初步建立。而交互技术,是决定我们在虚拟现实应用体验的关键因素。现有的人机交互技术,在基于小范围的、非高要求互动、非高精度定位与跟踪的虚拟实现解决方案中得到了很好的应用。可是随着我们对虚拟现实应用体验需求的不断提升,大范围场景的虚拟现实应用解决方案需求(手术训练,精密仪器拆解等)呈不断上升的趋势。为了解决在光学环境中遮挡导致光点丢失以至于姿态还原错误的问题,开始有公司尝试用惯性传感器数据去补偿光点在捕捉丢失下的位移数据,像Choi提出混合式光学跟踪系统、德国ART的混合运动捕捉系统等,而国内的信息,笔者查到了少数专利做过此项的研究,但是因为未知原因都没有公开和商用的信息。2019年7月底在洛杉矶召开的SIGGRAPH展会,笔者看到了第一套国产的光惯混合捕捉设备——Perception Neuron Studio,这是一套可以在虚拟现实、影视制作、医疗等多种领域使用的国产光惯混合动捕装备。

整体看来,光惯混合动捕

  1. 可以在光学环境受到使用遮挡的情况下继续使用惯性传感器的数据来补偿人体姿态信息,因此做到了比光学更强的耐受性
  2. 基于不丢失数据这点,活动范围可以不局限于光学场地,变相扩大了捕捉空间
  3. 惯性传感器的数据弥补增加了光学数据的利用率,在原有的相机基础上可以达到更大的精度

这极大弥补了原来两种设备各自的缺陷,例如惯性受到的数据干扰,光学的场地限制,都得到了一定解决。

好了,以上就是所有笔者整理的关于动作捕捉设备选购的方向,如果有更多疑问欢迎小窗交流。

本文谢绝转载,有不对的地方请指正。

The End