36氪专访 腾讯“小诤”:不当偶像网红的虚拟人还能做什么?
文 | 王毓婵 编 | 张信宇
11 月 7 日,“进入外太空”将近 5 个月后,小诤传回了她行走在火星表面的视频。这条视频展示了火星地表的景色和气象变化,在 B 站获得了 15 万播放和 700 多条评论。
小诤的身份是“新华社数字记者”、“全球首位数字航天员”,她由新华社媒体融合生产技术与系统国家重点实验室与腾讯互娱旗下 NExT Studios 联合打造,首次亮相于 6 月 17 日神舟十二号载人飞船发射的当天。按照规划,她未来会替代真人记者,完成在火星的新闻报道任务。
火星上的小诤
“这次火星之旅,是在多场景数字人资产运用取得了一定积累之后,面向下一阶段——‘大规模可交互数字场景’开展的关键尝试。你可以说它面向全真互联网的超级数字场景雏形。”NExT Studios 新技术研发中心副总监葛诚说。
为小诤提供技术支持的 NExT Studios (官方称作“腾讯互娱新体验与技术部”)是一家腾讯互娱旗下的电子游戏开发商,于 2017 年 4 月在中国上海成立。NExT Studios在创作超写实数字航天员之前,还发布过实时高保真数字人 Siren(塞壬)等。
NExT Studios 新技术研发中心副总监葛诚参与了对小诤和塞壬等数字人的塑造工作,也见证了近两年来该领域技术水平的提升——2017 年,为了创作塞壬,NExT Studios 花了四个跨国团队将近一年的时间。而今年,小诤从无到有,只用了 NExT Studios 15 名工程师的 3 个月。
小诤
以下为 36 氪与葛诚的采访实录:
从代码到火星——小诤的异世界之旅
36氪:小诤在火星的这一期视频是如何诞生的?Next Studios 做了哪些工作?
葛诚:这期高沉浸火星场景视频主要围绕小诤探秘火星展开,新华社负责总策划、脚本分镜设计以及人工智能语音合成等工作;NExT Studios 负责 3D 资产制作,场景搭建,特效仿真,音频制作,渲染合成等。
36氪:你们 2017 年创作塞壬时投入了很大的时间和人力成本,今年创作小诤就快了很多,效率是怎么提升的?
葛诚:可以从两个方面解释:一是塞壬追求的是和真人一模一样,而小诤是超写实,即 Artist 以真人为基础加以创作,所以她其实并不需要像某个真人,省去了不少 LookDev 的工程量;二是我们 2018 年做完塞壬之后,搭建了一条数字人制作管线 xFaceBuilder?。
从建模、绑定到动画,这条管线贯穿了数字人最关键的人脸制作的流程。xFaceBuilder? 帮我们省下了很多时间,所以我们仅仅花了两个半月,就为小诤做出了第一个视频。
36氪:在新华社的 B 站视频封面上写着一行字“按任意键进入游戏”,这是什么意思?未来普通人能够跟小诤有更多互动吗?
B站视频封面截图
葛诚:高沉浸互动数字场景是个有魅力的方向,借助 AI 和实时图形技术,我们希望能让普通人也能和高沉浸的数字内容互动。
36氪:小诤此次传回的行走在火星表面的视频看起来比之前复杂得多,Next Studios 是如何完成场景制作的?
葛诚:这次是我们第一次使用 UE5 实时出片,主要探索的是大场景、海量高解析度模型在 UE5 中的极限表现。角色资产的制作流程上,我们还是依靠自研的 xFaceBuilder 和 xMoCap(基于光学动捕的动画生产管线)两套管线,场景制作我们引入了 Houdini 过程化资产生成(PCG)能力,加速了场景资产的生产效率。
这次整个场景和角色资产从无到有,用了不到 3 个月时间,而且大量资产是可复用的,可能会用于未来的实时互动场景。
中国虚拟人的发展现状
36氪:xFaceBuilder 可以被应用在游戏开发中吗?
葛诚:可以。我们本身就是希望这套流程既可以生产数字人,也可以生产游戏角色。实际上,腾讯已经有项目开始使用 xFaceBuilder 完成了游戏角色的建模、绑定和动画制作等工作。
36氪:未来 xFaceBuilder 有可能会被开放出来吗?
葛诚:目前在腾讯内部它其实已经是一个开放状态了。但我们还需要打磨,因为它不仅要支持虚拟人,还要支持游戏角色,这个打磨的过程可能需要一两年。
36氪:从技术角度来说,创造虚拟人的底层基础设施已经比较完善了。最近有不少虚拟人网红出现,其中有些虚拟人甚至是只靠一个人的力量被创作出来的。未来创作和运营虚拟人会成为一件没有技术门槛的事情吗?
葛诚:整个虚拟人的制作分两个阶段,先是模型和绑定的制作,再是动画制作。前一个阶段相当于把模具做好,后一个阶段相当于用模具来生产产品。
把静态模型做到“好看”并不难。在电影 CG 行业,一些资深的模型师一个人就能调出非常好看、非常像真人的模型,吃的是模型师的手上功夫。更难的还是让它动起来也很自然传神,这就需要精细的动画技术,比如:物理仿真,绑定,动捕。我们在电影里经常能看到很像真人的CG角色,但让它实时地动起来就很困难。
小诤的面部细节
其次是动画制作。如果你想获得非常写实的画面,就需要有比较好的动捕设备、算法流程、动画TA、动画师。所以要让动画做出足够高的可信度也是一件很高成本的事。
今年四月,英伟达在发布会上展示了“虚拟黄仁勋”,但画面仅有约 15 秒。有人问:既然他们大费周章做了数字人,为什么不把老黄的整个演讲用虚拟画面呈现出来呢?科技目前还没有进步到可以非常快速且低成本地生产出电影级的动画。
当然,国内外很多 Researcher 和工程师都在为这个目标努力。比如 Epic 的 Metahuman 可以快速定制出高质量的角色,但是目前 Metahuman 有限的模板库还是很难满足模型师的创作需求。比如用 Metahuman 就很难捏出数字航天员小诤。
36氪:跨越恐怖谷(注:恐怖谷,由于机器人与人类相似,两者的细微差别会显得非常刺眼恐怖,使人有面对僵尸的感觉。)还是一个困难的工作吗?
葛诚:实时互动的写实向数字人,跨越恐怖谷依然是件很困难的工作,即便塞壬也就是刚跨过了恐怖谷的边缘。专业人士仔细看,还是可以看出来她不像真人的地方。当数字人趋近恐怖谷边缘时,普通人对数字人的恐惧感就趋向轻微。
36氪:小诤可以算是 NExT Studios 第一个投入实用场景的虚拟人,之前为什么没有对塞壬进行商业化运营?虚拟人的商业化时机已经成熟了吗?
葛诚:我们小团队在做前沿探索的时候,不会特别去考虑它的应用场景,因为这会限制探索的方向和深度。一旦确定某个方向具备了未来商业化的可能,我们会用 3-5 年的时间去打磨这条线上的技术。之前做塞壬和 Matt(NExT Studios 的另一个虚拟人)的时候,其实都没有过于纠结商业化,但是接下来做的一些新角色,我们会优先考虑跟商业化、运营相关的技术。
从 2017 年开始,国内已经有不少企业加入了虚拟偶像赛道,这个赛道目前来看是红红火火,但实际上平均利润率还是比较低的。大家并没有找到特别好的方式可以让一个角色像真人 IP 一样运转起来,这受限于技术、内容,更多的是商业模式还需要进一步探索。
但是我相信虚拟偶像产业目前还处在非常初级的阶段。接下来一定会有一个世界,可能是Metaverse(元宇宙),来承载风格各异的虚拟偶像。在那个世界里,每位虚拟人都拥有自己的 ID,也许还会有建立在 NFT(非同质化代币)上的交易。这样虚拟人就能与真人、真实世界建立更完整的商业关系和情感纽带。
现在各家单打独斗做虚拟人,今天做个屏保,明天做个直播,后天带个货……从 IP 角度来说,其实尚未形成虚拟 IP 成长的最好土壤,也就是“如同真实世界的数字世界”。
36氪:目前来看,虚拟人还是被集中应用在了娱乐产业中。除了当偶像,虚拟人未来可能还会有什么样的应用场景?
葛诚:未来虚拟人可能会成为人们远程沟通的媒介,但它不是现有视频聊天软件的衍生品。因为当一个可信的虚拟世界徐徐展开的时候,虚拟 IP 不再是现实世界中的一个附加品,而是虚拟世界中“实实在在”的存在。两个世界的界限也会渐渐打破。当下,最重要的是精进数字内容技术,在大众间打造高可信度的社交纽带。我们在朝着这个方向努力。