3D人体姿态公开数据集

Xsens动作捕捉 2023-04-08 5365

目前,已知的 3D 人体姿态的公开数据集有 Human3.6M、HumanEva、MPII、COCO等,这些数据集由 RBG 图像和人体关节点的空间坐标组成。根据拍摄人数的不同,数据集可分为单人数据集和多人数据集;根据图像是否连续,数据集可分为单帧图像数据集和连续帧视频数据集。单人连续帧视频数据集的制作,基本上均依靠动捕设备来捕捉真实人体关节点的空间坐标,同时也有数据集消耗大量人力进行手工标注,以下对几种公开数据集进行简要介绍。

3D人体姿态公开数据集  第1张

(1)Human3.6M 数据集:简称 H36M 数据集,是目前 3D 人体姿态估计领域中数据集样本数量最多、使用最为广泛的数据集。H36M 数据集共包含约 360 万张图像,共 11 个演员进行数据集录制,其中只有 S1、S5、S6、S7、S8、S9、S11 这 7 个人带有 3D 人体姿态标签。H36M 数据集中,分别从 4 个角度对演员进行拍摄录制,视频录制帧数为 50Hz,每位演员表演 17 种日常动作,例如:抽烟、照相、打招呼等。在3D 人体姿态估计领域的研究中,学者们通常会将 S1、S5、S6、S7、S8 这 5 个人的动作样本作为训练集,并将 S9、S11 两人的动作样本作为测试集对算法性能进行评测。 在使用 H36M 数据集时需要注意的是,部分视频的帧数与标注的 3D 人体关节点标签帧数不一致,需要对视频末尾帧数进行剪切后与 3D 人体关节点标签一一对应。

3D人体姿态公开数据集  第2张

(2)HumanEva 数据集:该数据集由动作捕捉设备制作而成,数据集共录制 4 个演员的 6 种日常动作,例如行走、慢跑、拳击、打招呼等,该数据集共包含 20610 张标注图像,学者们通常会将 S1、S2、S3 这 3 个人的动作作为训练集,共 10041 张图像,剩下的样本则作为测试集,共包含 10569 张图像。


3D人体姿态公开数据集  第4张
AI高级人工智能
10 次咨询
4.8
3437 次赞同
去咨询

The End