新华社AI主播到底怎么样?知名电视台邀请我们做了个测评
用脑科学+人工智能,解锁AI主播背后的秘密
现代科学技术帮我们实现了一个又一个人类梦想:千里传音、日行千里,是的,现在连“分身术”都做到了。
新华社联合搜狗推出了AI合成主播,它们运用最新人工智能技术,成功“克隆”出与真人主播拥有同样播报能力的“分身”。 与真人主播不同的是,AI合成主播能够全天候在线,7*24 小时播报,并且能全年无休。当伴随着一些肢体动作的时候,这个AI主播简直能以假乱真。
那么,观众感受如何?喜欢它吗?它会颠覆广播电视新闻吗?为了寻求答案,节律科技受CGTN频道下属周末节目New Money的邀请,做了一个科学测评。
为了研究观众观看AI主播视频时的感官体验、认知与思维状态和情绪感受,节律科技的研究人员以新华社AI主播(其声音和外形来自新华社主播邱浩)视频为案例,测试了AI主播产品的使用体验。
一、测试有必要吗?
一样都是看新闻,而且随着AI技术的发展,AI主播更加自然和逼真了,或许这一黑科技还会带来新奇感呢,所以有必要上升到测评这么严肃的事情上吗?
有必要,非常必要,理由如下:
1. 感官体验很重要
观看视频时,人的感受主要源于视觉和听觉通道的感官体验。 一方面,我们需要注意,当感官刺激由AI主播产生时,能否让感官通道获得同样的感受。
另一方面,AI生成的“主播”形象、动作和声音是分离的,我们需要知道观众能否自如地进行视听整合,比如主播的动作和口型是否与观众听到的声音协调。
2. 产品需“可用”
视频是一种信息传递形式。无论AI主播视频与真人主播视频的差异能否被观众意识到,我们都需要知道视频的功能有没有实现——即信息是否有效传达给观众、是否吸人注意、留下印象等。只有切实达到目的的产品,才是“可用”的产品。
3. 不可忽视用户体验 在追求“可用性”的同时,产品还追求“易用性”,即更好的用户体验,这个维度的考察分为“有没有不好的体验”和“能不能带来好的体验”两个方向。 对于第一个方向,我们需要考虑到“恐怖谷”理论。
“恐怖谷”理论表明,当一个虚拟的形象越接近真人时能带来更好的体验。但当这种相似达到一定程度(非常像),却又能被感受到并非真人(意识到是虚拟的)时,会突然引发巨大负面体验——带来恐惧、厌恶等感受。所以,AI主播是否会引发观看者的不适是我们想验证的一个目的。
对于第二个方向,我们需要注意到,AI主播在语音语调的丰富性、动作形象的自然灵活方面仍不如真人,那么它是否能够带来足够的良好体验?这也是值得考察的。
二、脑科学+人工智能,解密AI主播
虽然攻克大脑是艰巨的科学难题,但随着技术的发展,我们也解码了越来越多的不可言说的秘密。
节律科技是国内用人工智能研究脑科学的领先尖端研究公司和商业应用方案提供商,擅长用认知神经科学方法“捕捉”大脑信号,结合自研的深度学习算法“挖掘”、“量化”和“解读”大脑对事物实时、客观、多维度的体验和感受。
?节律科技创始人兼CEO马波博士接受CGTN New Money采访的视频截图
节律的研究成果目前应用在产品体验和消费者研究、教育产品和学习体验评测、老龄脑健康评测及保健、神经疾病辅助诊断预警等方面。
这次的测评便是使用神经生理信号的分析方法和人工智能算法,对产品体验的测试。
?节律科技首席研究员徐昊骙博士接受CGTN New Money采访的视频截图
我们知道,观众在观看AI主播新闻视频后,能够说出综合的体验感受,通过进一步思索后也许能报告出体验中具体元素带来的感受。但这种报告带有很强的主观性,常常被语言表达能力左右。
认知神经科学和AI的结合就不一样了。这种“联姻”能够解决这些“说不清”、“说不全”甚至“没说实话”的问题。
观众观看视频的体验是实时变化的,随着视频播放,脑电技术能记录观看过程的瞬间神经反应,通过瞬间神经反应,推断出瞬间的情绪反应及其它感官体验。
认知神经科学和人工智能结合的方法,可以让研究人员从脑电数据中分析各种反映心理活动的指标,进而得到有意义的体验信息——比如视觉的激活(包括视频的亮度、对比度),听觉的激活,情绪的感受(积极的或消极的,情绪是否强烈),整体观看过程中的记忆和注意力等。
三、测试步骤和发现
1. 测试步骤
说了那么多,测试具体是怎么操作的呢?研究人员给出了以下干货: 首先,就如在日常生活中看新闻一样,“被试”(被测试的人员)在高清显示屏上正常观看AI主播新闻视频。
整个观看过程中,研究人员通过高精度脑电采集设备实时采集“被试”的大脑信号,时间精度可达到1ms。
再经过后续分析,研究人员可以得到视觉体验、听觉体验、多通道整合、注意吸引、记忆印象、各类情绪等指标;进而再从这些指标中得出对视频给予的感官体验、信息传递和记忆有效性、以及情绪体验等方面的评价。
最后,通过对比观看AI主播视频,与其他一系列视频,包括真人主播视频、时间错位后的AI主播视频(研究人员把音频和画面打乱后特制的视频,以作为参照)、分离的AI主播视频(此时无声音),以及播放分离的AI主播音频时的“被试”的脑电结果,以进一步确定造成体验良好或不足的具体原因,并给出需要进一步改进的方向。
2. 测试发现:大脑对AI主播反馈如何?
通过实验,研究人员发现,“被试”对AI主播播报的内容有较高的关注度和积极情绪的唤起,对新闻内容的记忆情况也比较好。
不过,此次测试也让研究人员发现了AI主播的一些缺点。比如,随着长时间认知加工的进行,特别是视听加工的进行,视听方面的不完美会被逐渐放大。
另外,当AI主播的形象、动作和新闻的内容产生分离的时候,“被试”会产生疲劳感和厌恶感。
对于AI主播的未来将如何,节律科技创始人兼CEO马波博士给出了自己的看法:
“随着AI技术的发展,特别是自然语言处理和计算机视觉生成技术的发展,AI主播的形象和所表述的语言会更加自然和逼真。从认知角度来看,随着多通道信息的整合,AI形象对人们的认知方面将会有更有效的唤起。如果AI形象能对新闻内容进行‘理解’,并产生相应的动作和行为,那么对观众的吸引度将大大提高。”
此次邀请节律科技做AI主播测评的CGTNNew Money是中国国际电视台CGTN(中国中央电视台下属的国际传播机构,原CCTV-News)频道下属周末节目。
9月21的节目便是围绕AI主播展开的,通过走访首批AI主播背后的公司,节目探索了这些虚拟主播可应用的领域。
关注微博@CGTN-NewMoney或@节律科技可观看完整版节目。
关注“节律科技”可探索消费者/用户体验评测(是的,只要你的用户/消费者是人类,我们都能测)。
作者:节律实验室