提升协同工作效率,微美全息开发多用户眼动跟踪数据可视化系统
随着信息技术的发展,人机交互已经从简单的鼠标、键盘、操纵杆等设备输入,延伸到了基于生理信息、姿态、语音等的交互方式,眼动追踪技术便是一种新型的人机交互技术。眼睛是人体最为复杂的结构之一,也是人类获取信息的主要的渠道。眼动追踪技术是通过测量眼睛的注视点的位置或者眼球相对头部的运动而实现对眼球运动的追踪,从而实现监测用户在看特定目标时的眼睛运动和注视方向的目的。
据了解,全息AR第一股微美全息(NASDAQ:WIMI)正在研究与开发面向协同交互的多用户眼动跟踪数据可视化系统。随着数字图像处理技术的发展,以及计算机支持的协同工作等研究的深入,眼动跟踪技术将可应用于多人协同交互过程中,通过眼动数据的分享,实现多人协作信息的感知。
然后,在多人协同交互过程中,文本、语音、手势等形式的交互方式无法准确表达多人协同交互语义,如何将多用户的视觉注意资源形成一个有机的协作体也成为难点。为了解决这一难点问题,微美全息(NASDAQ:WIMI)研究开发了面向协同交互的多用户眼动跟踪数据可视化系统,通过实时获取、计算和传输协同环境下不同用户的眼动跟踪数据,并通过分析与可视化眼动跟踪数据,实现多用户协同交互过程中视觉注意行为和交互意图的协同感知,并在此基础上设计了相应系统的架构和各模块。
WIMI利用眼动跟踪数据可视化技术降低了语义歧义性,提高了多人协同交互质量水平与效率。并通过共享机制让个人用户根据自身的目标、意图等,匹配其他用户的视觉注意资源,从而降低自身认知负荷,提高交互效率和主观体验。
为了将眼动跟踪数据记录和处理产生的计算负荷合理地进行分配,并且尽可能地扩充协同环境下的多用户人数, WIMI研究的多用户协同眼动跟踪计算采用客户端/服务器(client/sever,简称 C/S)结构,其中,服务器负责记录客户端的眼动跟踪数据,并且进行处理、控制和转发;客户端负责眼动跟踪数据的计算、请求和可视化。所有的客户端只与服务器连接通信,客户端之间彼此不直接相连,而是通过服务器进行数据转发,实现相互通信。这种计算架构的优点是服务器提供了统一的数据转发模式,并且客户端所有的数据在服务器端汇聚,方便服务器进行统一的处理和分发。客户端则支持眼动跟踪标定、眼动跟踪数据计算等具体工作,然后发送到服务器。
WIMI开发的面向协同交互的多用户眼动跟踪数据可视化系统可运用在许多行业和领域,如教育、智慧驾驶、医疗影像分析及培训等领域。其代替了语音交互、可有效协助用户合作与分工、增强群体认知等。例如,在课堂教学场景下,用两个眼动跟踪系统记录两两配对学生的眼动数据,并作为联合注意资源进行分享,对于概念性知识的学习内容,联合注意资源越多,学习效果越好。在汽车驾驶场景下,坐在副驾驶位置的乘客可以给驾驶员提供路况信息,以弥补驾驶员由于视线盲区造成的信息获取不充分的缺陷,因此,记录副驾驶座位上乘客的注视点,并通过可视化方式呈现给驾驶员,可帮助其察觉相关路况信息,提高驾驶安全性。在远程医疗场景下,国际化的医疗会诊和手术团队中的成员来自不同国家和地区,可能会产生语言沟通障碍,为此,在模拟手术过程中综合使用语言、眼动发出协作指令,使不同成员合作完成目标选取任务,实验结果表明,眼动比语言协作的准确率和效率都会更高.在软件工程领域,使用多用户眼动跟踪及眼动跟踪数据可视化促进协同工作中的多用户协作与分工,提高代码审查效率。
在协同工作场景下,使用眼动仪记录多用户协同完成搜索任务时的眼动注视点并在公共屏幕上显示,使得用户可以看到协作者正在搜索的区域,从而有意识地避免重复和冗余搜索,提高效率;分析多个用户完成协同搜索任务时的眼动注视点分布规律,发现在不同交互方式下,用户眼动注视点的分布情况差异较大,尤其是在眼动数据可视化共享的情况下,不同用户的眼动注视点分布呈相互弥补趋势,分工意识更加明确,任务完成时间更短,可大大提高协同工作效率。
眼动追踪开启了丰富的人机交互新体验。未来,WIMI计划将眼动追踪技术与虚拟现实相结合,让用户获得更加真实的沉浸式体验,并准确掌握用户的视觉注意信息,为创建沉浸度更高的虚拟场景带来了全新的可能性,其在娱乐、购物、医疗等领域具有广阔的应用前景。