【经典文献】用于运动应用的人体动作捕捉系统的精度
摘要
目的:体育研究通常需要运动员的人体动作捕捉。然而,它可能是劳动密集型的,很难选择正确的系统,而制造商报告的规格是在设置中确定的,这些设置在体积,环境和运动方面与体育研究有很大不同。本综述的目的是帮助研究人员选择合适的动作捕捉系统,用于体育应用的实验设置。启动了一个开放的在线平台,以支持(体育)研究人员选择系统,并使他们能够贡献和更新概述。设计:系统审查;方法:在Scopus,Web of Science和Google Scholar中进行了电子搜索,并对筛选文章的参考文献列表进行了仔细审查,以确定学术上发表的体育分析研究中使用的人体运动捕捉系统。结果:本文概述了17种人体动作捕捉系统,报告了制造商给出的一般规格(传感器的重量和尺寸,最大捕获体积,环境可行性)以及同行评审研究中确定的校准规格。每个系统的精度根据测量范围绘制。结论:概述和图表可以帮助研究人员选择合适的测量系统。为了提高数据库的稳健性并跟上技术发展,我们鼓励研究人员在实验前进行准确性测试,并添加到图表和系统概述中(在线,开放获取)。
关键字:
运动学研究设计、运动准确性、捕获、3D 分析测量
亮点
本综述的目的是帮助研究人员选择合适的动作捕捉系统,用于体育应用的实验设置。
本文概述了17种人体动作捕捉系统,报告了制造商给出的一般规格和同行评审研究中确定的校准规格。
启动了一个开放的在线平台,以支持(体育)研究人员选择系统,并使他们能够贡献和更新概述。
引言
体育研究通常需要运动员的人体动作捕捉。人体动作捕捉是记录人体动作的过程;本综述的重点是记录运动员身体(段)的全球位置。它可能是劳动密集型的,很难获得有关测量系统的准确性和实际使用情况的信息。制造商报告的规格是在与进行体育研究的条件不同的条件和设置中确定的;这可以归因于体育研究领域的四个特征。
首先,体育研究在非实验室环境中进行,在进行运动的野外,溜冰场或竞技场上进行。受控实验室环境之外的这种区域带来了一些挑战,即不同的位置(例如室内与室外),天气条件(例如温度,湿度),测量干扰(例如噪声,散射,磁干扰)以及该区域中导致遮挡的障碍物。
其次,测量(捕获)体积通常很大(图1)。通常,精度与定位系统的覆盖范围成反比(即对于较大的测量体积,精度较低),这通常成为选择测量系统的限制因素。当参与者的位移变大时,测力计有时用于获取大量的运动周期(Begon,Colloud,Fohanno,Bahuaud和Monnet,2009).但是,这并不总是可取的,因为测力计上的运动可能与实际运动不同,或者仅仅是因为没有测力计可以复制运动。
第三,运动分析研究通常涉及高度动态的运动,这些运动比静态或慢速运动(例如步态分析)更难捕捉。例如,高采样频率的必要性带来了技术挑战。对于运动应用,典型采样频率介于 50 和 250 Hz(表二).它具有防止使用过高的采样频率以避免过多数据和避免高频噪声的偏好。只有在特定情况下,才需要非常高的频率(>1000 Hz),例如研究影响(如跳跃)或非常高速的运动(如棒球投球)。此外,该系统必须处理运动动力学,例如,这在惯性测量单元(IMU)中被证明是有问题的,其中线性加速度会干扰传感器融合算法的传感器方向估计。
第四,当测量系统需要将传感器、标记、应答器或标签直接放置在运动员身上时,传感器的尺寸和重量非常重要。特别是在高性能和高动态条件下,运动员的行动自由应受到最小的阻碍。
本文的目的是帮助研究人员选择合适的动作捕捉系统,用于体育应用的实验设置。为此,对同行评议的体育分析论文中使用的现有人体动作捕捉系统进行了文献综述。本文概述了制造商给出的测量系统及其规格(传感器的重量和尺寸,最大捕获体积,环境可行性),并报告了同行评审研究中确定的仪器误差(精度)。此外,还解释了每个系统的工作原理,因为这些原理决定了系统的局限性和特性。运动伪像和数据处理(如身体姿势重建方法和过滤)不属于本调查的范围。结果通过开放的在线平台提供,使(体育)研究人员能够为测量系统概述做出贡献和更新。
方法
我们在2012年10月至2013年1月以及2016年12月至2017年2月之间进行了文献检索。这两个搜索都是在Scopus,Web of Science和Google Scholar的数据库中使用以下三组关键字的组合进行的。第1组:测量,分析,系统;第2组:运动学,运动,力,坐标,旋转,方向,位置,位置,速度,速度,加速度;第3组:运动,滑冰,骑自行车,足球,田径,跑步,网球,游泳,曲棍球,棒球,篮球,滑雪和划船。检索仅限于英文论文,并发表在同行评审的期刊或会议论文集上。通过选定论文的参考文献列表获得了其他文献。
阅读检索到的论文的摘要以验证工作中是否使用了人类动作捕捉系统。我们专注于在运动实验环境中使用测量系统的论文。如果不是这样,则该论文被排除在进一步调查之外。阅读其余论文以获取有关测量系统精度的信息以及确定该精度的背景(环境条件,测试设置,运动类型和误差定义)。如果该论文在实验背景下不包括准确性评估,我们试图从该论文引用的研究中检索此信息。然后包括这些信息,尽管并不总是在体育背景下确定,因此在结果部分标记。如果没有发现关于准确性的同行评审论文,则该论文和系统将被排除在进一步评估之外。
结果
该文献研究共产生了20项关于测量精度的同行评审研究,讨论了17种不同的人体动作捕捉系统。这些系统列在表一.该表提供了制造商报告的系统环境能力,重量,尺寸和最大体积的一般规格。表二列出具有相应已发表研究和精度规格的相同系统。精度规格包括相机数量、标记数量、采样频率、参考系统、运动、统计值、测量体积或范围以及报告的精度。这些结果在在线交互式选择工具中进行处理。在图2中,精度与实验设置的范围相比较。正如预期的那样,系统的精度(等式1)与定位系统的覆盖范围成反比;换句话说,对于较大的测量体积,精度较低。
图 2. (A) 同行评审论文中报告的范围与准确性的图表(表二).指示的是几个常见运动场的范围。请注意,报告的范围不是测量系统的最大范围(为此,请参阅表一).(B) 适当测量系统的选择程序。该图可以分为四个象限,这些象限由所讨论的研究设置的最小测量范围和最小精度要求定义。左上角区域现在包含范围小且精度低的系统,我们将它们称为不适用(NA)。右下角区域包含满足范围和精度特定要求的系统,我们将参考那些适用的系统(A)。左下角区域是具有满足精度要求但没有所需范围的测量系统的区域;我们将这些系统称为低范围(LR)。右上方区域是系统满足范围要求但缺乏正确精度的区域,称为低精度 (LA)。图表中可能没有满足交易量精度要求 (A) 的系统。然后,可以通过传感器集成(Lee,Ohgi,& James,2012).然后,将来自不同测量系统的数据组合在一起以确定一个变量。例如,通过将IMU与GPS相结合,IMU的高采样频率与GPS的位置数据相结合,以补偿IMU的积分漂移(Brodie,Walmsley,& Page,2008年b;Waegli & Skaloud,2009;Xsens,2017).融合运动捕捉系统需要融合算法来组合两个测量单元(例如卡尔曼滤波器或比较滤波器)的数据。
表 1.总表:各厂家关于测量系统的规格。给出了传感器和系统的重量和尺寸,传感器的类型,以及最大捕获体积,标记物数量和采样频率。为一个相机或传感器提供最大捕获体积和采样频率;如果系统不受传感器数量限制的限制,则用“∞”表示。* 表示系统用于体育应用,但准确性是在不同的上下文中确定的(通过纸张的参考列表找到)。
表 2.精度表:同行评审文章(第2栏)中报告的一定范围内的测量系统及其精度。实验设置的规格在第3-7列中给出。最后两列(12-13)报告了图1图表中采用的范围和准确性;为此选择的最大报告范围(列9),准确率为95%置信区间(P95)(第10栏)。如果报告的统计值(第8列)不允许估计P95,则在第 11 栏中显示为注释。请注意,同行评审文章中的最大范围不是系统的最大捕获量(为此,请参阅一般表一).
与测量系统类型相关的实际和技术困难方面的规格高度依赖于其物理工作原理。在人体运动捕捉中,我们区分了五个工作原理:光电测量系统(OMS),电磁测量系统(EMS),图像处理系统(IMS),超声波定位系统(UMS)和惯性感觉系统(IMU)(van der Kruk,2013年b).根据这些工作原理,测量系统将在下一节中解释。图 1 总结了每种工作原理的一般优缺点。
光电测量系统
OMS 比其他系统更准确(图 2)。毫不奇怪,光学系统(例如Optotrak或Vicon)在文献中通常被视为动作捕捉的黄金标准(Corazza,Mündermann,Gambaretto,Ferrigno和Andriacchi,2010).OMS 检测光线,并使用此检测通过飞行时间三角测量来估计标记的 3D 位置。系统的准确性取决于实验设置的以下部分:相机彼此相对的位置,相机与标记之间的距离,现场标记的位置,数量和类型,以及捕获体积内标记的运动(Maletsky,Sun和Morton, 2007).此外,相机分辨率和采样频率之间也需要权衡。
OMS基于固定摄像头,因此只能在受限区域内采集数据(Begon等人,2009).捕获量取决于摄像机的最大数量和每个摄像机的视野。OMS的最大测量范围为824 m2,使用Vicon MX13测量系统(Sp?rri,Schiefermüller和Müller,获得,2016).对于这个范围,需要24台摄像机。如此多的摄像机在成本、便携性、校准、同步、人工和设置方面造成了重大的实际困难。该系统的进一步限制是视线的必要性,这意味着当相机看不到标记(Panjkota,Stancic,& Supuk,2009;斯波里等人,2016).此外,该系统对设置中的更改高度敏感,例如由于相机的意外移动(Windolf,G?tzen和Morlock,2008).该系统主要用于黑暗区域(室内),因为明亮的阳光会干扰测量(Sp?rri等人,2016).
光电系统内有两类:有源标记系统和无源标记系统。无源系统使用将光反射回传感器的标记。图表中的Vicon系统(图2)是被动动作捕捉系统的示例。有源系统利用包含传感器光源的标记(通常是红外)(Richards,1999).在图表中,Optotrak 3020是一种有源标记光学系统。与被动标记相比,主动标记的优点是测量值更可靠。然而,有源标记确实需要额外的电缆和电池,因此移动的自由度更为有限(Stancic,Supuk和Panjkota,2013).此外,当使用多个标记时,最大采样频率会降低,因为每个标记的信号需要具有可识别的频率来识别它。
增加基于标记的OMS范围的一种相当原始的方法是滚动动作捕捉系统(Begon等人,2009;Colloud, Chèze, André, & Bahuaud,2008).使用这种方法,将摄像机放置在固定的移动框架上,以满足摄像机之间固定相对位置的要求。该方法应用于划船的3D运动学分析,将三摄像头记录系统安装在船上,该船与划船者(Kersting,Kurpiers,Darlow,&Nolte)2008);这项研究显示,平均关节中心的精度约为30毫米。然而,Kersting等人得出结论,该方法非常耗时 - 主要是由于校准 - 并且不适合一般培训目的。
室内GPS(iGPS)是一种OMS,它不基于标记,而是基于连接到被跟踪对象或参与者的接收器(尼康,2017).与名称可能表明的相反,(物理)工作原理与常规GPS系统完全不同:该系统具有发射器,该系统使用激光和红外光将位置信息从发射器传输到接收器(尼康,2017).这是一个单向过程。该系统的优点是系统的可伸缩性几乎没有限制。因此,可以根据需要添加任意数量的发射器以覆盖(工厂)宽区域,并且可以使用无限数量的接收器(Khoury & Kamat,2009).系统精度,在室内溜冰场(12,600米)上确定2),为6.4毫米(范德克鲁克,2013a).该系统在运动中应用的重要缺点是需要连接到运动员的接收器的尺寸和重量(表一).
电磁测量系统
电磁系统(EMS)通过电磁波(无线电波)从应答器到基站的飞行时间(Stelzer,2004).EMS 提供较大的捕获量(图 2),但精度低于 OMS:图表中每个 EMS 的精度都低于性能最差的光电系统。与OMS不同,不需要视线来查找应答器的位置;人体对于所应用的场也是透明的(Schepers & Veltink,2010).与实验设置相关的系统的局限性是环境中铁磁性材料的灵敏度,这会降低数据的准确性(Day,Dumas和Murdoch,1998);此外,当基站和应答器之间的距离增加时,噪声增加,信号质量降低(Day等人,1998;Schuler, Bey, Shearn, & Butler,2005).EMS通常具有低采样频率,这是运动分析的缺点。使用多个标记时,频率会降低。
在EMS系统中,GPS-GLONASS双频系统显示出一个有希望的范围-精度组合:在15,000 m的范围内精度为0.04 m2.全球导航卫星系统是卫星导航系统,其中GPS,GLONASS和伽利略就是例子。卫星传输包含卫星位置和全球时间信息的数据。由于所有卫星的位置都不同,因此数据到达接收器所需的时间不同,因此可以选择确定卫星的距离。如果接收器从四颗卫星获得信息,则可以估计3D中的位置,尽管高度信息的确定比水平位移差2-3倍(Berber,Ustun和Yetkin,2012).请注意,在图中,所有GNSS系统都是差分GNSS系统,其中有一个额外的GNSS接收器作为测试站点5公里内的静态基站。基站卫星信号的测量与移动GNSS的测量相结合,以提高精度。
GNSS系统的缺点是GNSS接收器和天线的成本,重量和尺寸。GNSS系统不能在室内使用,并且对遮挡和室外天气也很敏感。全球导航卫星系统的准确性取决于其规格;例如,(低成本)单频GNSS单元的精度(高达4 m)远低于高成本双频单元(高达0.04 m),特别是在恶劣条件下(Duffield,Reid,Baker,& Spratford,2010;Tan, Wilson, & Lowe,2008).然而,高端双频单元更笨重。
与GNSS相反,所有其他EMS系统都可以在室内使用,因为它们使用本地基站而不是卫星信号。局部位置测量(LPM)由定位在整个区域的基站和受试者佩戴的应答器组成。主基站首先向每个应答器发送一个触发器,然后每个发射器将标记的电磁波发送到所有其他基站。与GNSS相同,至少有四个基站需要接收信号,以通过飞行时间确定应答器的3D位置。该系统可在室内和室外使用。对于3840 m区域内的动态情况(23 km / h),图表中显示的系统精度为0.23 m2.
与LPM的工作原理相媲美,但精度较差,是无线特设定位系统(WASP)系统;WASP使用放置在固定位置的标签和锚点节点来跟踪2D参与者。可以达到的精度取决于场地,从室内体育场馆的0.25米到穿过多面墙操作时的几米不等(Hedley等人,2010).在体育研究中,在室内篮球场(420米)的精度在0.48至0.7米之间2) (Hedley, Sathyan, & MacKintosh,2011;Sathyan, Shuttleworth, Hedley, & Davids,2012).精度也受到发射无线电信号带宽的限制。
射频识别(RFID)是一种无线非接触式系统,它使用电磁波和电磁场将数据从连接到物体的标签传输到RFID阅读器。有两种类型的标签:有源标签,主动发射无线电波,以及无源标签,它们只能在短距离内读取,因为它们通过磁场(感应)供电和读取。无源标签实际上没有寿命,因为它们不需要电池的任何电源(Shirehjini,Yassine和Shirmohammadi,2012).Shirehjini等人的RFID地毯(2012) 由无源标签组成,报告的精度为 0.17 米,精度为 5.4 米2区域(Shirehjini等人,2012).Ubisense是一个商用系统,最初是为企业设计的,用于跟踪资产和人员,使用有源RFID技术。在体育运动中,该系统在室内篮球场(420米)进行了测试。2),报告精度为0.19米(Perrat,Smith,Mason,Rhodes和Goosey-Tolfrey,2015;Rhodes, Mason, Perrat, Smith, & Goosey-Tolfrey,2014).
衰减,信号的交叉路径以及来自其他RFID标签,RFID阅读器和不同RF设备的干扰等因素会影响标签与RFID阅读器之间的通信(Ting,Kwok,Tsang,& Ho,2011).
图像处理系统
与EMS相比,IMS通常具有更好的精度,并且与OMS相比,范围更大。在图像处理中,对捕获的胶片或照片进行数字分析。与其他基于传感器的测量方法相反,这种方法是基于视觉的,使用光学相机和计算机视觉算法。这种无标记跟踪在体育运动中可能是一个很大的优势,例如用于事件检测(Zhong & Chang,2004).图像处理也有一些缺点:实时执行图像识别并不容易,可能需要昂贵的高质量和/或高速相机。精度还取决于实验设置,即相机相对于物体轨迹的位置,以及相机的数量(Lluna,Santiago,Defez,Dunai和Peris-Fajarnes,2011).此外,通常,相机分辨率的提高会导致可行的最大采样频率降低。
基于视觉的系统可分为两类:基于模型的跟踪和基于特征的跟踪。基于模型的跟踪使用跟踪对象的 3D 模型。在基于模型的跟踪的基本概念中,每个视频帧中的姿态信息都会更新,首先通过预测过滤器使用动态模型,然后通过视频帧中的测量来更新。基于模型的跟踪系统的缺点是它们难以在未知环境中使用并限制摄像机运动,因为需要附加信息,例如参与者和环境的3D模型(Bader,2011;切塞拉丘等人,2011).
基于特征的跟踪算法使用帧中的兴趣点来跟踪对象。有两种基于特征的跟踪算法:标记跟踪,它使用已知标记,以及无标记跟踪,它专注于跟踪2D特征,如角落,边缘或纹理(Akman,2012).请注意,IMS 中的标记跟踪与 OMS 不同,因为 IMS 使用(对于人类)可见光,而 OMS 则使用红外光。
对于标记跟踪,已知标记用于跟踪对象。这通常比检测自然特征(例如现有的角落或边缘)更准确,但是,在实验(网格设置)之前必须将标记精确地放置到位,并且可能发生标记的遮挡。在体育运动中,基于标记的特征跟踪已应用于滑雪和滑雪板轨道的运动学数据收集,其中在2500米的轨道上获得了0.04米的精度2range (Klous, Müller, & Schwameder,2010).
无标记跟踪消除了对环境先验知识的依赖,并扩大了操作范围。例如,这种自然跟踪是机器人视觉和增强现实领域的热门话题。然而,在这些应用中,相机实际上附着在被跟踪的对象上,这与体育应用程序相反,在体育应用程序中,相机是静态的,而平移,倾斜和/或变焦(Liu,Tang,Cheng,Huang,& Liu,2009).刘等(2009)在天花板上安装了一个平移摄像头,以在比赛期间使用滑冰运动员的颜色直方图跟踪短道速滑运动员;他们获得了0.23米的精度(面积810米)2).
这金泰科技断续器传感器它最初被设计为允许用户在不需要传统手持控制器的情况下与游戏系统进行交互,也可以归类为无标记跟踪设备,尽管其工作原理与之前描述的略有不同。该系统将红外激光斑点图案投射到红外热像仪的观察区域。该红外热像仪可检测图案,并通过测量参考斑点图案中的变形来创建3D地图。由于其低成本和合理的精度(7.5 m 时为 0.19 m2(杜塔,2012)),该设备通常用于科学研究(Bonnechere等人,2014;Choppin, Lane, & Wheat,2014;杜塔,2012).Kinect相机的缺点是视野小;此外,该系统在检测吸收光线的黑暗表面,导致镜面反射的闪亮表面和如果入射光入射角过大时粗糙的表面(Dutta,2012).
目前,现有的基于计算机视觉的测量系统的性能优于光电或EMS,其最大范围很小。虽然目前(2017年7月)没有成熟的系统,但有大量的开源代码可用,进展迅速(Scaramuzza & Fraundorfer,2011).提供具有人类运动学数据的开源数据库,使开发人员能够验证其算法(HumanEva,2017).这不仅可以验证已开发的系统,还可以简化开发研究设置的研究人员的系统之间的比较。
超声波定位系统
UMS最常用于短距离测量。UMS通过通过空气中传播的超声波的飞行时间来确定物体的位置。这些系统也称为声学测量系统,因为该系统通过声波起作用。声音和超声波的区别在于超声波对人耳是隐身的,这在研究中是有益的。超声波的缺点是与声音相比,范围有限。此外,在进行动态测量时,超声的方向性可能是一个缺点。在图表(图2)中,包括一个系统,该系统基于运动中的超声波定位,在9 m的区域内精度为0.05 m2(Bischoff, Heidmann, Rust, & Paul,2012).但是,请注意,此结果是通过与射频收发器的融合获得的。
惯性感测器测量系统
IMU是由加速度计,陀螺仪和磁力计组成的设备。通过将来自加速度计的信息 - 重力加速度 - 与来自陀螺仪的数据 - 旋转速度 - 相结合,可以确定设备的方向(Brodie,Walmsley和Page,2008a).磁力计用于跟踪磁北,以确定IMU的航向。市场上有许多商用IMU。
作为独立系统,设备无法确定其(全局)位置,因此不会添加到图表中。原则上,加速度计可以通过执行双积分来确定位置,但数据将受到较大的积分漂移的影响。这些系统在表中确实显示为融合运动捕捉系统(参见讨论)。例如,当IMU与人类的刚体模型(神经元,2017;Xsens,2017).因此,IMU被放置在身体段上以确定全局方向。IMU没有基站,因此是所有可用测量系统中移动性最强的。此外,该系统能够检测非常快速的运动(Zohlandt,Walk和Nawara,2012),并且对用户来说是非侵入性的,这使其成为体育运动中一个有吸引力的系统(例如体操(Zohlandt等人,2012),游泳(Lee,Burkett,Thiel和James,2011)).缺点是系统容易受到附近金属(实验设置)引起的测量误差的影响。此外,传感器融合算法对线性加速度很敏感。
讨论与结论:系统选择
为运动实验选择合适的动作捕捉系统可能很困难。图2旨在支持研究人员进行这种选择。图 2 的标题中解释了选择过程,也可以通过交互式选择工具 (https://human-motioncapture.com) 在线获取。
根据这项调查的结果,我们定义了一些广泛的运动类别,这些类别在测量系统中需要大致相同的特征(图1)。团队运动和个人运动之间划分。在团队运动中,系统通常用于球员的位置,距离,速度和加速度跟踪,而个人运动通常涉及某种技术分析。团队运动主要涉及较大的测量体积,并且咬合很常见。对于这些跟踪应用,准确性不如技术分析重要。因此,EMS是最合适的。个人运动除了室内与室外,还分为较大和较小量的运动。个人运动通常需要更高的精度。高精度 OMS 可以覆盖较小的卷。就测量运动学而言,目前,大量单项运动是最重要的运动。最合适的选择是IMS和IMU(融合)系统,但是,这些测量类别通常需要开发合适的算法(在IMS的情况下用于跟踪,或者在IMU的情况下进行融合滤波)。因此,总体而言,我们可以得出结论,在高精度捕获大体积的测量系统供应方面存在差距(图2)。这些规格主要用于室内(例如游泳,速度滑冰)和室外(例如划船,田径)的大批量个人运动。
(在线)选择工具使研究人员能够更快,更明智地选择适合其实验设置的测量系统。工具性错误取决于研究的背景(第2节)。因此,我们鼓励研究人员始终将校准程序报告为精度测试(即制造商的准确性报告,定制测试,单个组件精度测试)。此外,我们邀请研究人员在线添加此处显示的图表(图2)和系统概述。