如何看待大厂争相发布 数字人 虚拟人 数智人,有哪些关键信息值得关注

Xsens动作捕捉 2023-05-09 3577

1. 虚拟人:穿梭于现实与虚拟世界间的重要角色

1.1. 定义:数字技术驱动的拟人化形象,元宇宙必备分身

如何看待大厂争相发布 数字人  虚拟人  数智人,有哪些关键信息值得关注  第1张

一般而言,虚拟人指由 CG 技术构建、以代码形式运行的拟人化形象。笼统地说,虚拟人、数字人、虚拟数字人均指通过 CG 技术创造出的拟人化形象,他们被赋予鲜明的人物设定,以代码与数据的形式在计算设备上运行。严格来说,虚拟人强调其在外观上与真人的相似性;数字人强调其存在于二进制的数字世界中,既可以是根据真人生成的 1:1 数字孪生,亦可以是完全虚构的形象与身份;虚拟数字人则有着更为严格的定义,虚拟数字人具备三大特征:1)拥有人的外观及性格特征;2)拥有通过语言、表情或肢体动作表达的能力;3)拥有识别外界环境、与人交流互动的能力。本文将虚拟人、数字人、虚拟数字人三个概念统称为“虚拟人”。

如果将元宇宙比作驶向未来的飞船,那么虚拟人是必要的船票。对于用户而言,虚拟是任何人进入虚拟世界的必要化身,用户可以根据其喜好设置多个形象迥异的分身;对于经纪公司与 MCN 而言,虚拟偶像比真人违约风险低、公关风险低、管控力更强,因此其有意愿孵化虚拟偶像、虚拟主播;对于服务型企业而言,虚拟主持人、虚拟客服在普通 AI产品的基础上增强了互动体验并有利于塑造品牌形象。

因此我们认为,虚拟人在虚拟世界和真实世界中均扮演着重要角色,科幻小说《雪崩》亦将 Metaverse(元宇宙)、Avatar(虚拟化身)两个概念紧密关联。除了从制作主体与应用场景出发以外,虚拟人还可根据美术风格的不同划分为高保真、写实、卡通三类,根据驱动方式的不同划分为手动调节关键帧、预制动作、动作捕捉、语音/文字驱动四类。

1.2. 发展历程:形象写实化、交互多样化,当下步入成长期

虚拟人起源于 20 世纪 80 年代,在 CG、动捕、AI 等技术驱动下步入高速成长期。

1)萌芽:通过手绘、化妆打造虚拟人,以实现对美好的向往、对现实的批判。1982 年,动画作品《超时空要塞》中的女主角林明美凭借动人的歌声与纯真的人设走红,制作方顺势将其包装为歌手并发布个人音乐专辑,林明美因此成为全球首个虚拟偶像,也是全球首个虚拟人。虚拟主持人 Max Headroom 诞生于 1985 年,由覆盖厚重妆效的真人扮演,MaxHeadroom 通过重复、变声等故障行为对精致有序的统治阶层进行批判。

2)探索:随着 CG、动捕等技术问世,虚拟人在影视娱乐领域的应用进一步拓宽。自 20 世纪 80 年代以来,CG(计算机图形技术)、动作捕捉、面部捕捉等技术的快速发展为好莱坞电影带来深刻的变革,以数字技术为支撑的景观电影逐步取代叙事电影成为最受欢迎的类别,《指环王》《金刚》《阿凡达》等巨制中均出现虚拟人角色。2007 年,初音未来在VOCALOID 语音合成技术的加持下诞生,成为首个闻名世界的虚拟偶像,其热度延续至今。

3)初级:虚拟人形象越发逼真,AI 技术的发展使其开始向智能服务领域延伸。近五年来,自然语言处理、语音识别、计算机视觉等 AI 技术在虚拟人中的应用不断加深,具有智能交互能力的虚拟人崭露头角。例如,2018 年搜狗与新华社联合发布的虚拟主持人以高仿真形象示人,可对用户输入的新闻文本进行语音播报;2019 年,浦发银行首位虚拟员工“小浦”在服务客户时可感知对方情绪并辅之表情和手势,且具备主动学习、持续提高服务效率的能力。

4)成长:技术、需求均迎突破,虚拟人成果井喷。2019 年,视觉特效公司数字王国的软件研发主管 Doug Roble 在 TED 演讲中完美呈现其 1:1虚拟化身 Digi Doug,在高度还原本人外貌的前提下完成实时动捕,成为高保真虚拟人的里程碑事件。自 2020 年以来,虚拟偶像凭借独特的人设加速吸引年轻群体,以“会捉妖的美妆达人”柳夜熙为例,其在 2021 年10 月 31 日发布第一条抖音短视频后迅速获赞 300 万、涨粉超 100 万。

根据虚拟人制作技术及其在市场上的形态,可总结出一套通用系统框架。由于虚拟人的发展尚处于成长阶段,目前仍未形成统一的系统框架,但根据虚拟人制作技术及其在市场上的形态,人工智能产业发展联盟总结出了一套通用系统框架。根据该框架,虚拟人一般由五个模块构成,其中人物形象基于建模技术,语音生成模块基于 AI 技术,动画生成模块基于动作捕捉或 AI 技术,音视频合成显示模块将语音和动画部分结合以呈现给用户;交互模块为扩展项,一些侧重于展示的虚拟人不具备交互能力(如小红书、微博等平台上的虚拟 KOL),而强调交互的虚拟人可通过语音语义识别等 AI 技术或真人操控来完成与用户的交互。

真人驱动型虚拟人多应用于泛娱乐领域,智能驱动型虚拟人多应用于服务领域。具有交互能力的虚拟人可进一步划分为真人驱动型、智能驱动型两类,其中真人驱动型虚拟人是在完成原画建模和关键点绑定后,由佩戴动捕设备或特定摄像头的真人实时驱动,除设备购置外无其他技术成本,且互动感更为亲切,因此现阶段可交互虚拟人以真人驱动型为主,并在虚拟偶像、虚拟主播等娱乐领域广泛应用。智能驱动型虚拟人旨在简化各类业务流程以提升企业运作效率,作为当下尖端基础技术的集合体具备初始投入高、未来边际成本低的特质,因此目前着手开发此类虚拟人的企业多为百度、腾讯、搜狗、三星等大厂。

2. 技术方案:建模、AI、动捕、渲染是四大关键

虚拟人产业链由技术方案(基础层、平台层)与内容应用构成,其中基础层已形成稳固格局,应用层新锐企业崭露头角。虚拟人产业链从下至上可分为基础层、平台层、应用层,其中基础层为虚拟人的制作提供基础设施,例如芯片对传感器所采集的数据进行预处理并渲染模型,渲染引擎进一步优化灯光、毛发等细节,基础层领军企业主要为 Meta、英伟达、Unity 等技术壁垒深厚的巨头。

平台层中的软硬件系统企业从基础层获取数据信息后通过软件算法重现人物动作,生产技术服务平台提供一站式虚拟人解决方案,AI 能力平台提供交互技术能力,代表性企业包括腾讯、网易等互联网大厂以及商汤科技、科大讯飞等 AI 头部企业。在基于以上技术方案构建好虚拟人的“外壳”以后,部分虚拟人还需内容运营企业为其注入“灵魂”,而后应用于影视、传媒、游戏、金融等领域,近年来应用层涌现出众多新锐企业。

2.1. 建模:3D 建模技术成熟,动态光场指引新方向

在虚拟人通用系统框架背后,建模、AI、动捕、渲染是四大关键技术。

3D建模技术与动画制作软件已发展较为成熟,广泛应用于电影、游戏等领域。早期的 3D 建模技术以结构光扫描为主,虽可实现毫米级重建精度,但过长的扫描时间导致其难以对运动目标进行较好地刻画,近年来高速发展的多相机阵列技术克服了以上问题,成为当下主流的 3D 建模技术。以国内领先企业凌云光为例,该公司自主研发的高精度人脸 3D 建模系统可满足 20-140 台相机的高精度同步、快速拍摄与存储,由此获得的人脸模型可精确到皱纹、毛孔等细节。客户在获得模型的 3D 格式数据后,可进一步利用 Maya 等工具集对其进行处理以生成 3D 动画。

光场技术对光影效果的高质量呈现使其成为建模新方向,在VR/AR头显上的应用亦有望改善用户体验。光场可以测量三维世界中各个方向上流动的光,基于此特点动态光场重建技术可以更好地呈现不同观看视角下事物的光影效果,为 3D 建模提供更加丰富的图像信息,近年来微软、Google 等企业均积极探索该项技术在 3D 建模中的应用。此外,光场技术在 VR/AR 头显中的应用可以使头显模拟出人眼感知光线和聚焦的方式,从而呈现出更自然的观感,2021 年 4 月头显技术创业公司 CREAL发布的 VR 头显便采用光场显示器与中心凹结构,与大多数采用基础 3D显示技术的 VR 头显相比,CREAL 头显可以使用户在任何场景任意距离自动对焦,或显著改善由长时间佩戴设备导致的眩晕感。

2.2. AI:人机交互成长性高,文娱领域应用有望成为新蓝海

人工智能技术在政府城市治理和运营、制造等领域的应用趋于成熟,但在文娱领域的应用仍处于初级阶段。根据艾瑞咨询数据,政府城市治理和运营(公安、交警、司法、城市运营、政务等)是 AI 技术的主要应用领域,2020 年贡献收入占整体市场比例达 49%,其次为互联网、金融,份额分别达 18%、12%;艾媒咨询亦显示,AI 技术在安防、制造、金融等领域已有成熟应用,且市场体量较为可观。与上述成熟应用相比,AI技术在文娱、医疗、农业等领域的渗透率仍然较低,分支技术的突破与发展将成为改写行业份额格局的关键驱动因素。

从分支技术来看,人机交互产业规模高速增长,虚拟主播、数字员工等虚拟人应用打开市场空间。近年来随着深度学习算法不断优化、算力大幅增加,计算机视觉、自然语言处理等分支技术取得突破性进展,基于自然语言处理技术的人机交互产品及服务因此实现高速增长。2020 年人机交互核心产品规模有望同比增长 60%至 58.5 亿元,2019-2025 年 CAGR 有望达 36.5%,带动相关产业规模同比增长 94%至 486.9 亿元,2019-2025 年 CAGR 有望达 36.7%,增速显著高于 AI 技术大盘。现阶段人机交互技术主要用于实现金融、电信、电商等领域的客服及售后功能,虽可缩减成本、提高效率,但产品与 C 端用户的互动较为生硬、附加值偏低。与之相比,以虚拟主播、数字员工为代表的虚拟人将客服答疑、智能营销等多种功能合而为一,并有助于塑造客户品牌形象,有望成为人机交互产品的价值突破点。

除了打造语音交互功能外,AI 技术还可用于虚拟人的“捏脸”环节,网易伏羲是相关研究的拓荒者。满足玩家个性化需求的“捏脸”系统自单机游戏《上古卷轴 3》开创以来流行至今,现已广泛应用于《天涯明月刀》《逆水寒》等 MMORPG 游戏。在近 20 年的发展历程中,“捏脸”系统可供玩家调节的参数类型不断扩充,在提升个性化程度的同时亦大幅增加了“捏脸”环节的复杂程度。

为了让玩家轻松定制专属虚拟形象,2019 年 5 月网易伏羲 AI Lab 携手密歇根大学发明面部捕捉深度学习算法 MelnGame,仅需玩家上传一张人物肖像照片就可以生成虚拟面部的形状和纹理,与此同时该算法还会根据游戏年代设定调整面部特征,现已在《逆水寒》《永劫无间》等游戏中得到应用。网易伏羲 AI Lab 负责人李仁杰表示,未来 MelnGame 不仅会在 3D 游戏中广泛应用,还能促进更多社交活动从面对面走向网络化,其预测已在 2021 年 8 月网易伏羲发布的沉浸式活动系统“瑶台”中得到初步验证。

2.3. 动捕:高精度与低成本相悖,视觉捕捉或成性价比之选

动作捕捉是让虚拟人“动起来”的核心技术,现存三类方案各有优劣。按照实现方式的不同,动作捕捉技术可分为光学捕捉、惯性捕捉、视觉捕捉三类,其中光学捕捉通过摄像头对演员身上粘贴的马克点进行追踪来捕获演员动作,该方式可实现多目标同时捕捉,但对环境要求,且造价高昂;惯性捕捉的硬件基础是 IMU(惯性测量单元),通过算法计算IMU 在特定骨骼节点上的运动轨迹来实现动捕,该方案成本相对低廉,但精度较低,且会随着使用时间的增加累积误差;视觉捕捉以新兴的计算机视觉技术为底层技术,较上述两类方案而言更简单易用、成本更低,但与此同时算法开发难度大、精度难以得到保障。总而言之,现存方案各有优劣,难以兼顾高精度与低成本。(报告来源:未来智库)

三类动捕方案适用于不同场景,视觉捕捉或成为虚拟偶像的性价比之选。三类动捕方案的差异导致其应用场景存在差异,目前光学捕捉多应用于医疗、运动、电影等专业领域以及对高精度、低延迟要求较高的舞台,惯性捕捉在影视作品中亦有较多应用,视觉捕捉则更多地应用于消费级市场。以虚拟偶像的动捕为例,光学捕捉可以完美展示虚拟偶像的形象并实时驱动其舞蹈,2021 年 10 月国内领先企业青瞳视觉携手华为带来全球首个 5G+VR 二次元偶像直播;惯性捕捉可以较好地呈现 3D 虚拟偶像并与用户进行互动;视觉捕捉可以通过手机自带深感摄像头完成基础的面部与肢体捕捉,目前多应用于“纸片人”虚拟主播。随着虚拟偶像加速吸引年轻群体,低门槛的视觉捕捉方案有望成为 UGC 创作者涌入虚拟偶像赛道的首选。

2.4. 渲染:真实性与实时性显著提升,但需高性能硬件支撑

随着 PBR 渲染技术不断进步,高保真虚拟人突破恐怖谷效应。根据日本机器人专家森昌弘提出的恐怖谷理论,当机器人/虚拟人与真人的相似度高到某一临界点时,人们对其产生的反应将会由好感转变为极其反感,并产生排斥、恐惧等负面心理。因此,早期 3D 引擎渲染出的蜡像感虚拟人会给用户带来不适。随着 PBR 技术(基于物理的渲染技术)不断进步,Unreal Engine 4、Unity 3D 5 等渲染引擎均能更真实地反映模型表面折反射光线的强弱,从而突破恐怖谷效应

如何看待大厂争相发布 数字人  虚拟人  数智人,有哪些关键信息值得关注  第2张

MetaHuman Creator显著降低高保真虚拟人制作门槛,任何人可在数分钟内完成创作。Epic Games 旗下渲染引擎 Unreal Engine 于 2021 年 2 月推出高保真虚拟人制作工具 MetaHuman Creator,该工具拥有从发型、肤质到体型等多种真人扫描素材,用户可自行组合素材以快速创建高保真虚拟人,基于 Unreal Engine 的渲染能力,MetaHuman Creator 可实现光源在不同肤色、纹理下的不同呈现,从而达到高精细度。

实时渲染是支撑虚拟人实时互动的核心技术,对硬件能力提出较高要求。电影、游戏宣传片、广告短片等预录内容多采用离线渲染技术,设计师可花费大量时间完善细节,但对于舞台表演、直播等实时交互场景,离线渲染不再适用。与数小时渲染一帧画面的离线渲染相比,实时渲染每秒至少渲染 30 帧画面,对硬件能力提出了较高要求,目前英伟达 RTX显卡及其平台可提供高效的 GPU 渲染解决方案。另一方面,受限于有限的计算资源,实时渲染可持续时效亦有限,倘若计算能力或渲染能力不足,将会在实时互动中出现穿模、静止等“翻车”现象。

3. 内容应用:虚拟偶像迅速爆发,掀起虚拟化潮流

不同功能的虚拟人可赋能不同领域,虚拟偶像的流行有望催化虚拟人在其他领域的渗透。从影视到游戏再到新兴的虚拟偶像(包括虚拟歌手、虚拟主播、超写实 KOL 等),泛娱乐领域是虚拟人最先渗透且应用最为广泛的领域。随着虚拟偶像的热度不断攀升,大众对于虚拟人的接受程度有望持续提升,从而带动虚拟人在金融、文旅、教育等领域的渗透,为 C 端用户带来智能高效的人性化服务。

3.1. 泛娱乐:虚拟偶像市场广阔,虚拟主持人迈进广电门槛

3.1.1. 虚拟偶像:人设好、颜值高,自 2020 年以来迅速爆发

虚拟偶像已成为承接现实、启示元宇宙的重要角色。初音未来诞生于2007 年,是全球首个以语音合成技术为基础开发的 2D 虚拟歌手,也是全球首个现象级虚拟偶像,此后随着 3D 建模、AI、动作捕捉、全息投影等技术进步,虚拟偶像的设计逐步向 3D 乃至超写实方向发展,其身份由歌手向主播、KOL 延伸,与粉丝的互动性亦在技术的支撑下不断增强。除了从 0 孵化的形象外,虚拟偶像亦可脱胎于游戏 IP,例如《英雄联盟》推出女团 KDA、《王者荣耀》推出男团无限王者团。历经十余年发展后,虚拟偶像在大型演出、品牌活动、内容社区、短视频平台中的现身越发频繁,已成为穿梭于虚拟世界与现实世界间的重要角色。

虚拟偶像按职能可划分为虚拟歌手、虚拟主播、超写实 KOL 三类,对技术的要求及商业模式均有所不同。虚拟歌手的定位通常为专业虚拟偶像,其声源来自 VOCALOID 语音合成器或知名歌手,对 3D 建模、动捕设备等技术要求较高,若举办 Live 演唱会还需采用全息投影技术并进行高精度实时渲染,专业内容+专业技术使虚拟歌手拥有类似于真人偶像的粉丝经济。虚拟主播的专业程度较虚拟歌手而言更低,其对技术的要求亦相应更低,主要通过互动打赏与直播带货创收。超写实 KOL 拥有精致且特别的外貌,其对 3D 建模的要求通常高于虚拟主播,一些甚至超过虚拟歌手。超写实 KOL可进一步划分为内容社区 KOL、短视频KOL,前者主要生产图文内容,无需动捕设备,后者则对动捕与渲染技术提出一定要求,二者的创收方式均以广告营销为主。此外,亦有采用虚拟形象的 UGC 创作者活跃于社交平台,主要通过虚拟道具创收。

凭借人设讨喜“不塌房”的特质,虚拟偶像成功吸引了众多 90 后粉丝。

根据调研数据,62.6%用户喜欢虚拟偶像是因为其不会有负面新闻,49.6%是因为喜欢二次元文化;艾媒咨询数据显示,虚拟偶像爱好者中 92.3%年龄介于 19-30 岁,75%月平均收入在 5000 元以上,可见虚拟偶像受众以看重偶像人设、收入位于中高水平的 90 后为主。

对于运营方而言,虚拟偶像商业安全感更强、可控性更强。与真人偶像相比,虚拟偶像的孵化无需经历数年的培训,并且违约风险低、公关风险低、更易管控,这一特点吸引传统经纪公司着手尝试。以头部经纪公司乐华娱乐为例,其在 2020 年 11 月推出虚拟偶像团体 A-Soul,并按照真人训练生培养模式对 A-Soul 进行运营。基于乐华丰富的艺人运营经验,该团体出道后迅速圈粉,成员嘉然在 B站直播间的人气值不断攀升,根据数据,嘉然舰团数(付月费的粉丝数)已达 6000个,远超过菜菜子 Nanako、阿萨 Aza 等头部虚拟主播。

对于品牌方而言,虚拟偶像有助于塑造年轻化的品牌形象。2019年4月,肯德基在 Instagram 上推出自己的超写实 KOL 桑德斯上校,此次全新亮相颠覆了品牌在顾客心中的“老爷爷”形象。2020 年 9 月,超写实 KOL翎 Ling 与特斯拉展开跨界合作,广告大片将翎 Ling 的中式美学与特斯拉的现代感合而为一,呈现出独特的科技视觉效果,从而吸引年轻群体对品牌的关注。

在真人偶像负面新闻频发、疫情催化线上娱乐的背景下,2020年成为国内虚拟偶像爆发的元年。近年来真人偶像负面新闻频发,不仅伤害粉丝情感,亦严重损害经纪公司、合作品牌方的利益,致使众多粉丝与企业转向虚拟偶像。疫情的催化进一步提升用户对于虚拟主播的关注度,根据数据,2019-2021 年 B 站虚拟主播直播数当日高峰约为 50/300/500,对应人气值约为 100 万/500 万/1600 万。日益旺盛的用户需求使虚拟偶像相关企业备受资本青睐,2020 年以来企业融资速度明显加快。基于需求端用户偏好转变、供给端密集融资加速发展,我们认为2020 年是国内虚拟偶像爆发的元年。

柳夜熙因一条虚实融合的短视频迅速走红,成为虚拟偶像出圈的标志性人物。2021 年 10 月 31 日,“会捉妖的虚拟美妆达人”柳夜熙在抖音上发布首条短视频,在约 2 分钟的时间内呈现出虚实融合的绚丽视效,并恰到好处地融入了魔幻悬疑剧情。柳夜熙在发布首条短视频的一日内涨粉 135 万、一周内涨粉超 430 万,截至目前抖音平台上#柳夜熙#相关短视频数量超 8000 个、播放量达 4.2 亿次,#挑战柳夜熙仿妆#相关短视频数量达 13.4 万个、播放量达 4.5 亿次。(报告来源:未来智库)

柳夜熙走红背后是内容创意的升级与技术的精湛呈现。柳夜熙并非首位在抖音上走红的超写实 KOL,早在 2020 年 10 月 5 日,“跨次元数字少女”阿喜凭借可爱的外貌与活泼的性格吸引了一批粉丝,但其影响力却远不及柳夜熙。之所以柳夜熙能吸引更广泛的用户,除了神秘的人设、独特的妆效、魔幻的剧情以外,还因为该条短视频以极高的精度展示了虚拟人与真人的自然交互,呈现出元宇宙的一种可能性。

随着虚拟偶像与各方合作加深,2021年有望撬动千亿市场。虚拟偶像商业变现路径与真人偶像类似,通过销售演唱会门票、专辑以及直播打赏等方式直接创收,通过广告代言、直播带货、授权 IP 销售衍生品等方式带动周边市场。根据艾媒咨询数据,虚拟偶像商业价值迅速提升,2021年核心市场规模有望同比增长 79.8%至 62.2 亿元,带动市场规模有望同比增长 66.5%至 1074.9 亿元。

虚拟偶像前期投入成本高企,技术进步有望显著提升盈利能力。作为内容+技术的产物,一个优秀的虚拟偶像不仅对孵化团队的艺术审美、人设打造与运营提出较高要求,亦需要多种技术支撑以实现形象、人设的输出,因此现阶段制作与规划运营成本较高,培育虚拟偶像的全流程成本可至数百万元,头豹研究院数据显示,目前实现盈利的虚拟偶像不足30%。未来随着技术不断进步,以及引擎工具迭代升级,创造虚拟偶像的技术成本有望被大幅压缩,届时盈利能力有望显著增强。

3.1.2. 虚拟主持人:政策推进节目形态创新,虚拟主持人或加速渗透

广电总局发文鼓励虚拟主持人的应用,由此提高制播效率和智能化水平。10 月 20 日,广电总局发布《广播电视和网络视听“十四五”科技发展规划》,文中提出要推动虚拟主播、动画手语广泛应用于新闻播报、天气预报、综艺科教等节目生产,创新节目形态,提高制播效率和智能化水平。《规划》亦指出,虚拟形象合成技术包括 2D 虚拟形象的合成、3D虚拟形象的驱动、虚拟引擎构建、语音驱动、动作捕捉、面部表情捕捉等技术,为企业探索虚拟主持人指明技术方向。

芒果 TV率先布局虚拟主持人并构建首个虚拟直播演唱会厂牌,有望在技术加持下扩大其内容优势。9 月 17 日,芒果 TV推出首个虚拟主持人YAOYAO,芒果 TV 创新研究院负责人张亦弛称 YAOYAO 将会是平台探索虚拟技术赛道的重要组成部分。湖南卫视随后于 10 月 2 日推出其首个虚拟主持人小漾,目前小漾已在微博上发布多条宣传综艺节目的短视频。此外,芒果 TV 亦积极探索 XR 技术在舞台现场中的应用,于 9月 29 日推出《潮音实验室》首场全虚拟实时直播演唱会,为用户带来真实世界中无法见证的梦幻体验,该场演唱会采用实时深度交互系统以实现虚实融合的直播,为了实现更自然的融合效果,现场同时采用了真实灯光照明系统和虚拟灯光系统。随着真实世界与虚拟世界的融合不断加深,芒果 TV 有望把握技术+内容新趋势迎来新成长。

3.2. 其他:电商直播、教育、文旅等领域应用方兴未艾

AI 虚拟主播以低成本获取闲时流量,阿里、百度加码智能直播赛道。在电商直播领域,除了头部达人直播带货以外,品牌自播渐成主流趋势,平台方亦不断加大对品牌自播的流量扶持。但受制于有限的精力,店员仅能在固定的黄金时间段进行直播,在此情况下 7×24 小时介绍产品“不会累”的 AI 虚拟主播可有效辅助品牌抢占闲时流量。目前中科深智是AI 虚拟主播领域的领先企业,已为 2000 余个淘宝直播间提供全栈式解决方案,阿里云、百度 AI 开放平台亦于近期推出智能直播间解决方案,未来 AI 虚拟主播有望加速渗透。

虚拟人在教育、文旅等领域亦迎来初步应用。2020 年 6 月,虚谷未来科技推出全国首位教育领域虚拟人小艾,其人设为喜欢阅读、善于分享的12 岁少女,旨在以领读陪伴的“班长”身份激发少儿阅读兴趣,截至目前小艾已参与《中国诗词大会》《时空课堂》等多个知识类节目,并以科普博主身份活跃于视频号、抖音等多个平台。2020 年 11 月,网易伏羲首个 AI 智慧文旅项目落地杭州中国丝绸城,该项目将《逆水寒》中人设、技能与丝绸文化高度相关的“素问”流派虚拟人融入数字展厅,用户可通过按下琴键进行实时互动,“素问”将随旋律变化而起舞,文化输出与虚拟人创意交互的融合有望成为未来文旅发展的一大新方向。

4. 主要参与者:英伟达领航,国内厂商蓄势待发

海外巨头聚焦于虚拟人的基础建设,国内领先企业更侧重AI技术的开发与内容应用。虚拟人产业链的基础层均为技术壁垒深厚的海外巨头,典型代表如英伟达、Epic Games、Unity 均基于自身技术优势向下游生产技术服务平台延伸。国内领先企业更多的是自研 AI 系统并探索虚拟人在社交活动、新闻媒体、文旅等领域的应用,亦有大量新锐企业如万像科技、次世文化专注于虚拟偶像的孵化与运营。

英伟达发力“工程师元宇宙”Omniverse,成为构筑虚拟世界、赋能真实世界的重要领军者。英伟达虚拟协作平台 Omniverse 于 2020 年 12 月开放测试,该平台为开发者提供一系列技术与工具,以助其高效构建 3D 虚拟场景或真实世界的数字孪生,其中数字孪生可应用于智慧城市的精细化管理、模拟工厂车间进行故障预测和分析,从而缩短决策流程、提高生产的安全性,因此 Omniverse 在多个领域的应用均有裨益。在 2021 年4 月的 GTC 2021 GPU 技术大会上,英伟达 CEO 黄仁勋以逼真的 1:1 虚拟化身现身 14 秒,其所处场景亦为渲染出来的虚拟画面,从而展示Omniverse 强大的仿真能力。在 2021 年 11 月的 GTC 2021 人工智能大会上,英伟达再次强调 Omniverse 是“工程师元宇宙”,未来的虚拟世界将如同当下的网站一般不断涌现。

依托 GPU+AI 优势,英伟达进一步推出用于创建 AI 虚拟形象的技术平台 Omniverse Avatar。Omniverse Avatar 在 2021 年 11 月的 GTC 2021 人工智能大会上正式发布,该平台将现有的语音识别技术、推荐引擎、视频处理和分析技术、大型语言模型、面部动画和渲染技术、光线追踪技术等融为一体,基于以上核心 SDK 用户可创建具备交互能力的 AI 虚拟形象。根据风格与应用场景的不同,英伟达推出的虚拟人分为三类,一是根据本人形象生成的卡通虚拟人 Toy-Me,二是可实时进行多语种翻译的超写实虚拟人,三是可进行零售结账与客户服务的虚拟机器人,英伟达相信 Omniverse Avatar 将在五年内迅速完成对世界各地汽车餐厅、快餐店、零售店等实体店的渗透,真人与虚拟人的交互次数将不断提高。

就国内市场而言,网易是前瞻性布局虚拟人且已实现多领域应用的典型代表。网易旗下伏羲 AI Lab 是国内泛娱乐领域 AI 研究及应用的顶尖机构,于 2019 年 5 月发明 AI 捏脸算法 MeInGame 推出首个 AI 捏脸系统,于 2021 年 8 月发布国内首个沉浸式活动系统——“瑶台”,在虚拟人制作技术及其应用方面均位于行业前列,目前已将多种风格虚拟人应用于游戏、数字服务、虚拟直播、文旅展示、“瑶台”等多个领域。2021 年 10月,网易战略完成对虚拟偶像运营公司次世文化 A+轮融资的领投,网易有望借此拓宽虚拟人应用场景、扩大现有优势。

The End