运动捕捉系统的原理是什么？

Xsens动作捕捉 2023-05-11 5559

一、什么是运动捕捉

运动捕捉是记录物体或人的运动的过程，也被称作动作捕捉或动捕。该技术还涉及尺寸测量、物理空间里物体的定位及方位测定等能够借助计算机直接处理的数据。这一技术广泛应用于机器人、无人机、多智能体集群协同控制、军事、医疗、体育、科研及电影、动画、游戏、虚拟直播领域。从技术原理层面区分，可以将动捕分为：光学式、惯性式、机械式、声学式和电磁式。其中机械式、声学式、电磁式动作捕捉系统，随着时代的发展，受限于自身各种缺点，已逐渐淘汰出市场，现在行业中普遍使用红外光学动作捕捉或惯性动作捕捉。

1.惯性动作捕捉

惯性导航传感器、信号接收器以及数据处理系统构成了惯性传感器式动作捕捉系统。将姿态传感器穿戴在人体各个主要肢体部位，可将姿态信号无线传输至数据处理系统进行运动解算。其中姿态传感器集成了惯性传感器、重力传感器、加速度计、磁感应计、微陀螺仪等元素，得到各部分肢体的姿态信息，再结合骨骼的长度信息和骨骼层级连接关系，计算出关节点的空间位置信息。

优点：
便携且操作简单，可在户外使用。

缺点：
· 定位不准——通过肢体姿态信息进行积分运算得到的空间位置信息具有不同程度的积分漂移，且一些传感器还会被周围环境磁场影响进而影响精度；
· 续航力弱——充电一次后可持续工作时间有限，不适合长时间使用；
· 数据漂移——原理本身基于单脚支撑和地面约束假设，无法进行双脚离地的运动定位解算；
· 动作受限——传感器自身重量和线缆连接还是会对演员的动作表演造成一定约束；
· 成本翻番——尤其在被捕捉对象数量增加时，设备的成本直接成倍增长，丧失价格优势。

2.光学式动作捕捉

通过布置在场地内的多个光学镜头从不同角度捕捉固定在人体/物体表面的反光标识点的位置信息，捕捉其动作姿态。根据被捕捉物/人不同的特征，还可将光学动捕分成无标记点式光学动作捕捉系统、标记点式光学动作捕捉系统。

(1) 无标记点式光学动作捕捉原理：
· 第一种是基于普通视频图像的运动捕捉，通过提取人体关节点在二维图像中的坐标，再根据多相机视觉三维测量计算关节的三维空间坐标。
· 第二种是基于主动热源照射分离前后景信息的红外相机图像的运动捕捉，也称为热能式动作捕捉，原理和第一种类似。
· 第三种是三维深度信息的运动捕捉，系统基于结构光编码投射实时获取视场内物体的三维深度信息，根据三维形貌进行人形检测，提取关节运动轨迹。

总体而言，无标记点式动作捕捉目前仍存在动捕精度低、动作变形等问题。

(2) 标记点式光学动作捕捉原理：
标记点式光学动作捕捉系统凭借多个光学相机从各个角度捕捉黏贴在被捕捉物/人关键节点部位的Marker点，并实时传输到数据处理工作站，利用三角测量原理计算出该点精确的空间坐标，再结算出骨骼的六自由度运动。无论主动式还是被动式光学动捕都是以标记点的类型为依据进行的分类。

a.主动式
使用LED作为标识点，在人体关节部位黏贴LED之后再通过线缆连接，为电源供电。

优点：
跟踪准确率较高，识别鲁棒性好。且自带光源，因此可在室内、室外使用，不受场地限制。

缺点：
· 运动变形——时序编码的LED识别原理是依赖相机在各个时刻对多个的标记点采集成像标识ID，破坏了同步性，而且有效动作帧的采样率偏低，不适合捕捉快速动作及数据分析；
· 精度较低——LED标识点的可视角度小，一个光学动捕镜头的内部往往集成了两个相机近距离采集，而此类窄基线结构直接影响视觉三维测量的精度；
· 成本加倍——同上一个问题，运动时难免出现动作遮挡导致数据缺失，想要解决遮挡盲区的问题，只有成倍增加镜头的数量，而设备成本也随之上涨；
· 人数受限——还是受到时序编码原理的局限，系统只能承载一定数量的标识点，通常同一时间最多不要超过2个人进行动捕采集。

b.被动式

被动式光学动作捕捉系统中使用反光标识点黏贴在被捕捉物/人身上关键节点部位，光学动捕相机发出的红外光由marker表面反光涂层反射到动捕相机中以对该点进行三维空间内的定位。

优点：
技术成熟，高精度、高采样率、低延迟且定位精准，动作表演无障碍，且标记点成本低能够灵活增加、布点，水下环境也可适用。

缺点：
· 环境约束——被动式marker点自身不发光，通过调节光学相机阈值进行采集，阳光直射或其他反射物的干扰会影响捕捉效果；
· 不抗遮挡——反光标记点一旦在运动时被完全遮住，会造成动作错位，需要后期人工修复数据，或者使用光惯混合的方式避免遮挡。

性能	惯性式	无点式	主动式	被动式
定位精度	低	低	中	高
采样频率	高	低	低	高
数据质量	中	低	中	高
快速捕捉能力	高	低	低	高
被捕捉物数量	中	低	中	高
运动范围	大	小	中	中
受干扰物	铁磁体	阳光、热源	强光源	阳光
便捷度	低	高	低	中
适用性	中	低	中	高