我们能否使用动作捕捉和虚拟现实等技术让流水线上的工人们在家里就能进行生产活动
技术背景介绍
动作捕捉,又称“运动捕捉”,英文Motion capture,简称Mocap,是一种捕捉、记录并处理人或其他物体动作的机器视觉技术。目前,运动捕捉在许多领域都得到了广泛的运用。在游戏行业中运用动作捕捉技术研发的体感游戏机,实现用户与游戏情景的融合,有效地提高了用户的游戏体验;影视行业中,通过此项技术采集人脸表情与肢体动作,运用到虚拟人物角色的创建中;在体育运动科学分析中,收集运动员的训练动作,并进行科学的、系统化的分析,为每位运动员量身定制专属训练方案,纠正运动员不规范动作,提高训练效率。运动捕捉技术是集机器视觉、人体工程学、生物力学、计算机科学等多领域于一体的综合化技术实现手段,随着技术的不断成熟,动作捕捉技术也将在其他领域得到推广。
应用场景
生产车间是业内公认的环境最复杂、模式最多变、人机参与度最高的场景,车间在生产运行过程中,设备的稳定运转必须依赖人员日常维护工作,而频繁的人员活动同时也增加了人员伤亡事故发生的风险,特别是某些产业中的高位作业环境中其表现更为明显,如自动化产线的登高维护作业、化工企业反应釜的日常生产、强电作业中的带电作业等等。一旦因为作业人员因工作疏忽造成人员伤亡,不但给企业造成巨大的经济损失,也随之带来一系列的政策与社会风险。
目前,在工业领域高位作业环境的安全监管往往通过规范化作业流程管控和现场安全监管为主要手段,虽然能够在很大程度上降低安全生产事故的发生的概率,但是因人为监管不利而发生的事故仍层出不穷。随着动作捕捉技术的不断成熟,其在人体动作识别与环境识别中的优秀能力将逐步推广到工厂高危生产场景中,也将作为一种全新的生产安全监管模式融入工厂的生产作业执行过程中。
场景的选择
鉴于整体技术成熟度,当前处理大规模复杂工业生产场景中的设备与人员行为捕捉存在较大的困难,整体的采集与分析效果也不尽如人意。但是在限定空间中与固定生产机位的条件下,动作捕捉能够取得较好的实现效果。
所以,在场景的选择中应尽量做到空间位置相对固定,无设备的频繁更换,机械动作成周期运动规律或相对静止。当应用场景选择完成后,即可确定应用空间坐标系原点,并由原点延伸出三维坐标轴,以适当的单位长度规定坐标尺度,以感光贴纸锚定象限点位。至此,场景的物理空间划定工作完成。
光学设备的选择与定位
动作捕捉是以高精度光学设备为硬件基础的,故在光学设备的选择上应根据场景的实际需求,选取适当的光学仪器作为主要采样工具。因工业环境复杂多样,往往存在着烟尘、反射光、衍射光、漫反射光的影响,所以在设备选取中应综合考虑,基于实际生产场景理化属性与设备性能进行匹配。
当完成必要的光学仪器选择与采购,即需分析场景实际的空间构型。目前,场景空间构型以空间立方体居多(如应用场景空间复杂可根据实际情况进行空间分割,尽量满足简单的空间构型,为后续的数据分析提供便利。),通过激光测距仪定位空间构型的XY象限中心,YZ象限中心、XZ象限中心,并在各中心安装光学摄像头(如空间条件不允许缺少安装位,可转换象限,或在不影响正常生产的情况下,增设延长支架进行设备部署)。并基于空间投影比例调整摄像头焦距,使正视图设备、左视图设备、俯视图设备处于同一投影比例,防止后续产生动作捕捉影像的投影误差。
通过对场景的分析和生产运维人员的调研工作,确定设备生产运维高危区域,并划定危险作业范围(有条件的可以通过感光贴纸进行现场标定),将危险区域以包络线的形式映射到场景模型中,形成真实场景与模型的相对比例映射,尽可能做到真实还原。
在场景模型建设完成后,可以安排测试人员进入实际场景进行人体骨架图的特征提取(如光学设备拥有骨架图抽取功能,可以跳过此环节)。测试人员在场景范围内做出各种动作,由光学摄像头进行样本采集,并通过动作提取进行人体骨架图模型的构建。至此,基本的应用模型构建完成。
工作流程分析
经过上述环节与步骤,高危作业环境的空间场景已经存在于系统的模型库中,当运维人员进入高危环境中进行作业时,摄像头即准确识别出人体结构,三象限摄像头从三个角度回传人体图像信息,经三维位置转换与实时动作捕捉计算,在场景模型中构建人体骨架图模型。当人体骨架图模型接近或者触碰高危区域包络线,即可通过语音播报系统对现场发出声光报警,提示作业人员即将或者已经进入危险区域,作业人员和现场监督人员接到报警信息后,及时纠正违规动作,避免生产作业事故的发生。
高危环境动作捕捉系统的优势
1、复杂环境下的高适应性
得益于近几年光学硬件的飞速发展,光学设备无论从识别度还是从适应性上都有了较大的提高,在以往大部分的光学设备难以适用于高温、高压、高湿的车间环境。而随着硬件技术的发展,设备的性能已经完全满足工厂生产环境,图像的高精度提取识别,都为动作捕捉系统提供了有利的开发实践环境。
2、多象限同步捕捉,提高动作识别率
传统的动作捕捉往往因只选取一个象限面,很难区分肢体重叠画面,继而严重影响动作分析的准确程度,并且单面的图像采集很难进行有效建模,无法构建人体的三维动作模型,对于工业高位场景来说难以推广应用。而高位环境动作捕捉系统在规定空间构建中,选取三视觉角度,就可以最大程度上还原人体真实动作意图,有效提高了识别精确性。
3、场景主体与人体模型客体综合分析
人体模型作为动作分析的主体在机器视觉领域中占据着主流地位,但是面对复杂的工业生产环境将人作为主体分析很难得出有效的动作辨识(如:在工业场景中,骨架图趴卧或单脚腾空大部分情况是进行设备维护)。这种情况如仍以人体模型为主体研究将得出与真实情景极大差别的结果。工业场景中,多变的是生产场景,应以场景模型为主体进行分析,得到相应的变化参数量,然后将人体模型作为客体,在大的基础场景模型中来分析客体的行为动作,主客综合分析才能获取更接近真实情境的结果反馈。