火爆出圈,站上风口的数字人到底是什么“人”? 十问大咖

Xsens动作捕捉 2023-05-10 3122

作者 | 刘燕

火爆出圈,站上风口的数字人到底是什么“人”? 十问大咖  第1张

采访嘉宾 | 李笛,李士岩


在元宇宙风潮之下,数字人先火了。


近两年,国内数字人项目呈现井喷态势,科技巨头集体入场。IDC 预计,到 2026 年中国 AI 数字人市场规模将达到 102.4 亿元。作为时下最热的技术话题,我们判断,开发者有必要对数字人技术有完整的认知和理解。


在此背景下,InfoQ 特别策划了《数字人基础技术解析》专题。本专题将首先对数字人做概要介绍,紧接着围绕数字人的技术、应用落地等维度分别做解读。我们将收集来自国内业界一流团队的最佳实践,供读者参考。


本文是本专题的概述篇:「十问数字人」。本文,InfoQ 特邀小冰公司 CEO 李笛,百度数字人与机器人业务负责人李士岩一同解读了大家关注的十个焦点问题,剖析数字人到底是什么,一探数字人的发展现状和未来。


以下为对话全文,经编辑。


InfoQ 第一问:如果请您用通俗的语言,来阐述什么是数字人,您会如何描述;虚拟数字人目前在业内达成共识的、相对权威的定义是什么?


李笛: 目前数字人的概念过于宽泛,因为概念很多。简单而言,如果在数字世界里用一个 3D 建模建出了一个人的形状,这就是数字人。


基于不同的渊源,不同的人对数字人有不同的定义。一类数字人是利用 3D 建模、动作捕捉等技术实现的超写实数字人。超写实数字人的典型代表是虚拟偶像,它以 IP 的方式出现,可以与人互动,和用户有一定的情感链接。另一类数字人通常出现在影视内容生产中,例如在好莱坞影视作品的特效中,由非真人演员扮演的虚拟形象被认为是数字人,它主要起到内容演绎的作用。


小冰希望的数字人是能和人交流的,在某种程度上是可以环绕在人们周围的一个新角色,它能在我们的生活、社交网络中扮演一个新的角色,而非只是在视频中看到它,也不只是在形象代言的时候看到它。它像是我们的一个好朋友,可以和人交流,或者它是银行的客户经理,汽车里的智能助理,人可以和它交流……这就是我们所定义的数字人—— 即 AI Being。相比之下,前两类数字人的外在是虚拟的,AI Being 不只外在是虚拟的,更强调内在能够自驱。


我们认为,交互和自驱方向的虚拟人是一个像人一样的实例,即 Instance,Instance 知道自己应该怎样说话和交流。有了这样的能力后,再赋予它一个外形,无论是通过 3D 建模或其他方式构建的,只要有声音交互,就知道它是一个拟人的、独立的实体。


李士岩: 广义上看,我认为一个比较准确的定义是,数字人就是具备人类的外形和行为的数字化载体。从场景的角度,我们认为它是一类新的内容和交互载体。更长远来看,我们认为它是元宇宙中的一类核心的交互和内容载体。


在数字人的分类上,目前大家的认知比较一致,一方面是通过场景分类,是做服务的还是做内容的。另一方面通过风格分类,包括 2D 卡通、3D 超写实,3D 写实、3D 半写实、3D 卡通等类别。


InfoQ 第二问:近两年,数字人十分火热,成为新晋技术热词。为什么是这样一个时间点,数字人火了起来?


李笛: 我们在去年的发布会上提过一个观点,AI Being 将会成为快速增长的趋势,当时台下很多观众还一脸懵。而今年,就经历了这样的过程。


为什么我们当时会这么认为?首先,整个市场的流量红利正在逐渐消减,交互正在越来越深化。当你每天在 N 多个 APP 上交互,和更多的人进行交互……我们就会越来越难以承载这样的交互。因此,很多场景需要用人工智能来代替人做出社交决定。


此外,社交网络的深化产生了一些新问题,如明星塌房事件频发,有明星因私生活有问题影响到了演艺生活。理论上互不影响,但由于是同一主体,人类在社交中有很多侧面,可控性较差。相对而言,人工智能的可控性就很高。当社交网络发展到一定深度,这个时代的社交网络已经无孔不入,没有隐私可言,当私生活或隐私构成了公众人物商业价值的一部分时,其商业价值存在不确定性。这也在一定程度上,说明了 AI Being 存在的意义。


李士岩: 数字人本质就是一条被技术驱动的赛道。从最早的没有交互能力,完全卡通化的阶段发展到现在人像具有多种风格,能被 AI 驱动,可以 24 小时与用户对话的阶段,本质上是技术在助推。由于技术发展到了可以向场景中应用的阶段,再加上客户以及用户的旺盛需求,他们“握手”到一起,促成了这一波数字人的行业热潮。


InfoQ 第三问:虚拟数字人,数字人,虚拟人,这三个概念常常容易混淆,这三者之间的关联和区别是什么?


李笛: 现在数字人的概念外延较大,容易被泛化,概念常混淆,常见的是虚拟人泛化成数字人,需要注意厘清。


这三个概念本身是包含关系。虚拟人,简单来说,如果用一个数码绘图版,在 iPad 里画了一个二次元的、2D 的人,这个人就是虚拟人,它是拟人的,有眼睛、鼻子、嘴巴就可以。虚拟人强调外在,且只要有外在就可以了。


虚拟数字人,在虚拟人表象外之上,加了一个数字的概念。数字指的是,它一定要有某种形式的行为,如某种形式的运动,这个行为在一定程度上可以自驱。例如一个真人演员身上绑定了 VR 头显来控制前台的人,人在屏幕上看到是一个虚拟数字人正在动,它不一定是 AI 自驱的,它说的每一句话都可能是后面那个真人所说的,可以简单理解为它没有大脑。


而数字人是一个完全后端自驱的形象。我们认为,数字人的表述是最准确的,因为它是真正的由 AI 驱动的,数字人的声音是 AI 生成的,驱动数字人说话的文本也是 AI 生成的。


李士岩: 我们更倾向于将它叫作数字人,因为我们更希望它通过数字化的形式来服务于企业的内容生产、营销等维度。


我们认为,数字人是大的数字化浪潮下的一个分支。虚拟人的定义更多在强调非实体化的概念。而我们正在做的事,是通过在大的数字化浪潮的基础上,促进实体行业的发展。所以我认为,这两个概念有一些区别,我们更倾向于把它定位为数字人。至于虚拟数字人,跟前两个概念既有不同,也有一定重叠的部分,这种叫法,可能是行业里应用到某个特殊领域内的一种说法。


InfoQ 第四问:数字人是元宇宙带火的第一个概念。元宇宙被认为是下一个互联网的范式,而现在元宇宙未至,数字人先行,数字人在元宇宙里,扮演的角色是什么?



李笛: 元宇宙是一种独特的、新的虚拟空间,虚拟空间和现实世界是互相对应的世界。我们所认为的 AI Being 存在于虚拟空间中,人类也在这个空间里。人不可能一直在元宇宙里,还是要把头显摘下来,回到客厅等现实空间,这时,客厅的智能设备也在。数字人不局限于任何一个空间,元宇宙是它存在的其中一个空间。


未来是现实的人和数字人都在元宇宙里。小冰的思路是,AI Being 是向着人的方向贴近的,人能做什么,它就能做什么。人和数字人都会在一个元宇宙的空间去交互,当离开元宇宙的时候,它们仍然可以交互。


此外,元宇宙这种新的虚拟空间,某种意义上来讲,最缺人。有人认为元宇宙一出来就爆满,其实不然,元宇宙最缺人,最容易出现的就是空荡荡的元宇宙。


为什么最缺人?因为还没有产生一个普遍的必要性,人为什么要去元宇宙?近期来看,普遍的必要性是指,大家摸得着的价值,很多人会把元宇宙和游戏、旅游结合在一起,因为这些场景为空间提供了必要性。


李士岩: 我个人对元宇宙的狭义定义,它是长在空间计算平台上的新的互联网。那显然,它首先必须要基于一个空间计算平台。当空间计算平台在用户内部的渗透率,或者出货量达到一定的规模,才存在长在它之上的互联网的基础。


我认为元宇宙也有一个广义的定义,就是,它虽然是在一个像手机这样的平面计算平台上,但有一个三维空间的、APP 的形式存在于平面计算平台之上。我认为这也属于元宇宙的一个早期阶段。


数字人跟元宇宙之间的关系,我们认为,无论是广义的还是狭义元宇宙,数字人都将是元宇宙里一类非常重要的互动载体、内容载体以及服务载体。


InfoQ 第五问:构建数字人制作流程复杂,所涉及的的核心技术包括哪些?其中,AI 技术是不是最为核心的技术?


李笛: 人工智能是 AI Being 这类数字人的核心技术。但对于以 3D 为主的虚拟人,可能并不是真的需要人工智能,比如运营 IP,台前的虚拟偶像可能说的每句话背后都是“中之人”控制,它不具有自驱性,人工智能对它来说意义不大。


实现自驱,人工智能才有意义。因为它能够高并发,能够让 AI 在同一时间为所有人提供服务,并且提供的是不同的服务。在同一时间,它对每一个人说的话都是不同的,不是靠后台的“中之人”配合。人工智能主要在数字人的两个部分上体现,一是后台的 Soul 上,如何用 AI 技术让 AI Being 表达其所想表达的东西;二是 Body,数字人的表情、声音等是不是 AI 生成的。


具体在技术上,主要涉及到自然语言处理,计算机视觉、智能语音三个技术大类。各家具体在细节上有所区别,如在 NLP 领域,有人坚持封闭域,我们一直坚持的是全领域,数字人能很好地像一个人一样与其他人聊天。在视觉领域有两个方向,一个是 CG,现在看到的 3D 虚拟人,主要通过建模的方式来实现,我们做的是神经网络渲染方向。


神经网络渲染基于的理念是,透涉到视网膜上的成像就是看到的世界,跳过了构建的中间步骤,它足够拟真,但因为没有经过建模过程,会让人有种空落落的感觉。去年,神经网络渲染跟 3D 建模技术相比还有很多差异,但到现在已经逐渐加速。现在很多应用把 3D 建模技术与渲染技术结合在一起使用。


李士岩: 在数字人构建的过程中,AI 是最核心的技术,因为数字人最核心的就是几个技术节点,包括数字人与数字资产的生成,数字人的智能互动,以及通过数字人智能驱动来生产内容。在这三个节点里,无论是哪一个,现在都受制于人工生产,成本高、效率低。我们认为,有效地改变这一现状的几乎唯一的路径就是 AI 自动地生产数字资产,AI 自动化地生产内容。通过 AI 的知识库,多模交互的技术让数字人实现智能地互动,这里面每个环节最核心的都是 AI 技术,对这方面我们非常坚定。


InfoQ 第六问:现阶段,构建数字人的技术难点是什么?


李笛: 这取决于做哪种分类。


如果做虚拟偶像,前面有个“Body”,后面用动捕把“Body”驱动起来,某种程度上,这个“Body”就只是一个壳子。“Body”由“中之人”掌控。它强调的是驱动,不是自驱。这种模式的难点是,如何用技术把“中之人”砍掉,让“Body”不要呈现出“中之人”的影子和特征。这样,即便原有的“中之人”被换掉,也不会影响到用户。

火爆出圈,站上风口的数字人到底是什么“人”? 十问大咖  第2张


动画类虚拟人通常是真人拍摄,然后把人脸换了,注重剧情。这种模式的难点是,如何降低成本。要想做一个超写实数字人,做好渲染,时间成本和人力成本都很高,可能一秒钟就要几万元。制作成本超过使用真人演员,内容回收成本也低于真人演员,难以形成可持续的制作模式。因此,现在业内会采用超写实虚拟人的 3D 建模技术,以更快、更低成本地采用数字人。


对于 AI Being 这类虚拟数字人,难点往往不在于前端,也不在于由真人驱动,而是在于 AI 如何实现自驱。当 AI 表达内容时,它的回应内容是否合理,它的声音是否与回应内容相适配,当它在说一句话时,当语义中带有喜怒哀乐的情绪时,它能否准确反映出这些情绪。在说话时,能否通过 AI 自然地驱动躯体做出与说话内容相一致的表现。对我们来说,挑战在于如何突破人工智能技术的难点,让虚拟的身体可以更自然地被驱动起来。为解决这个问题,小冰框架内置了 1500 个模型,可以很好地一起协同驱动 AI Being,使之说的话更有相关性、更合理,这些模型分别负责不同的方向,有的负责在对话中将话题引导到合理方向,有的驱动声音和唱歌时候的一致性等。


李士岩: 最主要的技术难点还是我上面提到的那三个技术节点上,我认为在早期阶段需要有大量成本的投入来进一步提升效果和效率。例如针对数字人的内容生产环节,该环节正在逐步进入深水区,现在手语播报、文本播报等播报类内容,唱歌等表演类内容、肢体类内容已经做的比较好了,但叙事类内容如何实现智能生产,这里面涉及到很多跨领域的技术,包括跨模态的技术,都很值得非常多的资源投入。


InfoQ 第七问:数字人的应用场景主要有哪些?目前应用企业和场景是否比较有限?数字人如果要实现大规模的落地存在的制约因素是什么?距离大规模落地大概多长时间?


李笛: 我们已经在推进商业化应用,例如在日本,小冰公司中标的 2025 日本大阪世博会的项目,届时小冰框架将会创造 60 万个不同个性的虚拟人“陪护者”,进入老年家庭,提供 24 小时不间断地陪伴。在中国,也创造了很多虚拟员工,如万科集团年度优秀员工“崔筱盼”、红杉中国首位虚拟分析师“Hóng”、每日经济新闻虚拟主播“N 小黑”和“N 小白”等,它们是真正“干活”的员工。我们还给一百多家纺织企业提供设计平台,到现在已经 4 年了。


现阶段数字人在企业的 Marketing 部门应用较多,主要基于品牌宣传的目的。我们认为,数字人的应用价值体现在三方面,要么提供情感价值(AI Companion),要么提供员工价值(AI Employee),要么提供专家价值(AI Expert),例如 AI 教练,具备这些特征才能真正落地。


在如今快节奏的时代,越来越多人的社交是不完整的,陪伴愈发成为一种普遍的诉求和价值。而在员工价值方面,现在绝大多企业都有数字化的社交,如企业微信、微信等,沉淀私域流量,交互频率超高,这些都可以进行 AI Being 化;这两种诉求都存在于各行各业的普遍诉求,因此,我们认为, AI Being 具有较强的可扩展性,每个行业都可以应用。数字人不是只能在某一垂直场景使用,专门干“一种活”。


李士岩: 我们看到,数字人在企业中的落地速度越来越快,企业应用数字人的数量上的增长速度可能已经超过了 50%以上。从 19 年我们给浦发做的数字人小浦,目前每月为 45 万用户提供有温度的金融服务,北京冬奥会我们的 AI 手语数字人为 2700 万听障用户提供直播及赛事的手语服务,为央视网打造数字主播小 C,主持了非常多场次节目,包括两会期间采访对话人大代表,文博虚拟宣推官“文夭夭”,以多个“数字人分身”同时服务数十上百家博物馆,提供讲解、导览、主持对话、直播等服务。近期我们也是为中国日报打造了首位数字员工“元曦”此外,数字人在行业的收入规模增速也在加快。


目前数字人落地的限制因素,我们认为主要是使用门槛高、效率不够高,操作不方便等因素。百度在近期发布了“数字明星运营平台 1.0”及“数字人直播平台 2.0”等标准化的 SaaS 产品,它们既降低了企业应用数字人的门槛和成本,也让数字人在企业内部变成一个像 office 一样易用的使用工具。


我认为,距离数字人大规模落地的时间应该很快就会到来,应该在未来一年到两年之内。数字人在一些如直播带货、企业服务等垂类场景的渗透率会有大幅提升,因为,在这些场景的数字人产品正在逐步走向成熟,成本大幅降低,应用的门槛也越来越低。但例如趋势性内容的生产,这个领域可能还需要 1—2 年的时间继续做技术攻关和打磨。概括起来看,在细分场景内的渗透率在一年之内将会有非常高的增长,有一些场景还存在技术制约,需要技术不断突破。


InfoQ 第八问:生成式 AI 最近爆火,您如何看待生成式 AI 的发展以及生成式 AI 在数字人上的应用?生成式 AI 背后依靠大模型, 业内也有一些厂商在采用小模型的方案,您认为是大模型还是小模型更适合?


李笛: 我们从 2017 年开始做生成式 AI,小冰在绘画、设计、音乐的生成上,已经好几年有稳定的收益了。最近技术发展日新月异,但大的方向基本不变。


大家讨论的“生成”大多是,有一个模型在,这个模型可以生成高质量的插画就可以了。这种做出来的是一个“画笔”,这个画笔可以根据需求创作,但如果直接把这样的技术拿过来做商业化,它一定会进入到一个廉价的成本经销模式。因为,人是有创造力的,从人类设计师那得到的画作你可能愿意愿意付一百块,从 AI 那得到的画作,且不论质量,你可能连一块都不愿意付,因为你觉得它是廉价的。


内容产业有一个重要特点是,它是高附加值且有区分度的,不同内容的创作者定价不同,不完全取决于本身的作品质量。但用 AI 创作不同的绘画,定价是相同的,这样容易把一个高附加值的市场“打”成一个低附加值的市场。


为什么内容产业是一个高附加值的市场?不仅仅在于内容产业不断在创新,同时又在于内容产业是一个强交互和强沟通的市场,如果用户满意创作,可以沟通修改,但 AI 不能修改,只能重新做。


但如果这个思路转变一下。我们几年前就开始做生成式 AI,我们不是在做“画笔”,而是在做一个“手拿画笔的人”,我们不是在做能画画的 AI,而是在做能画画的 AI Being。我们侧重把创作的能力,把生成的能力赋予 AI Being,让 AI Being 本身具有价值,这样它就能继续保持高附加值的特点,更符合内容产业的客观规律,这是我们尝试的方向。我们探索 AIGC 比较早,刚开始做内容生成的时候可能不为大家所理解,现在以及未来一两年,大家越来越意识到,AI 的创作者变得更重要了。


关于数字人适合走哪条模型路线,小冰框架的 1500 多个模型各有各的作用。今天有观点提出来应该走大模型,一方面是大模型的确在质量上有提高,第二是在某些地方如果用大模型会比用小模型要好。


但为什么会存在争论?因为有些地方用小模型要比用大模型要好,而没有绝对的完美,


只用一个模型就能解决问题,我们认为未来的趋势一定是混合的解决方案。大模型的参数规模大,但时间和金钱成本也很高。当对相关性要求高的交互场景,如和金融领域的数字人交流,客户要求较高,这时,用大模型要比用小模型强,但用大模型,交互成本很高,交互周期较久。日常情况交流过程或者简单的对话系统,自然小模型更为适合。


我认为,大模型和小模型不是“新时代”和“旧时代”的类比。我们有时候理解,大模型是新,它会取代小模型。事实上,他们各有优劣势,而不是一个新旧取代的过程。如果要做的是一个庞大的系统,必然面临把模型组织在一起,核心问题在于如何能够很好地融合。未来, AI Being 这类数字人将逐渐采用融合型的模型方案。


李士岩: 最近 AI 生成这个方向确实非常火,这个赛道在本质上属于 AIGC,通过人工智能来生产内容。我们现在初步判断,目前利用这种新的方式生产内容还属于发展的早期阶段,需要不断地走向深水区。从内容复杂性来看,例如我上面提到的,AI 自动生产的内容在最开始多是手语播报类,口语播报类等内容,未来会逐渐向着表演类和叙事类的深水区迈进。


从内容形式看,目前 AIGC 的内容更多是基于文本、音乐和静态图像为主,图文影音这四大信息有种类会进一步拓展,既在深度上扩展,也会在宽度上扩展。例如动态图像未来也能 AIGC,例如音乐,浅层的生成可能是某种乐器,可能是某个人声。未来纵深的发展方向可以是多种乐器混合、流行歌曲等。


我认为 AIGC 会呈现一横一纵的趋势发展,横的方向上是信息的种类、图文影音,由图文音向影逐步地过渡得越来越好;在纵向的发展上,每个信息的维度都有可纵向发展的空间。我们看好并比较确定这一趋势,因为三维内容的生产成本和三维内容的需求量间已有了非常大的矛盾,现在生产的效率不能满足需求量,我们认为一个非常有效的解决路径就是 AIGC。


根据我们的观察,尤其是 AIGC 相关的技术,在数字人模型的智能生产和内容的智能生产这两个维度,我们确实看到了大模型的优越性。因为它生产的内容更接近于用户输入的描述,生产的种类更多、更丰富,具有更好的扩展性。就我们目前看到的现象来讲,我们认为大模型更好。


InfoQ 第九问:从行业全局的角度看,数字人如何实现商业化,其可行的盈利模式有哪些?现阶段数字人要实现这种大规模的落地还有哪些制约因素?


李笛: AI 商业化,一直很困难。此前,市场先后走到了几个误区,一个是走了系统集成路线,因为 AI 技术本身很难商业化变现,所以价值系统集成是一个显著代表的路径,还有一类是做软硬结合的,在硬件里体现软件。


我们走的 AI 商业化的路径是, AI Being 的高附加值以及可拓展性是它的收入来源。不同企业都有共同的 AI Being 的需求,但他们的 AI 可以干不同的事情,我们可以做标准化的交付的解决方案。


如果具体到数字人而言,我认为它不可行的盈利模式有,把它变成硬件,把虚拟数字人变成实体数字人,将 AI 数字人做系统集成。我个人认为,这些并不是持久的盈利模式。因为 AI Being 最重要的特点就是无处不在,开车时它也在,回家时它也在,玩游戏时它也在……如果把它实体化了,它的实体在哪它就在哪,它的实体不在了,就削减了它作为 AI 自身的优点。我们认为,持久的盈利模式还是利用数字人的高并发能力去做标准化的交付,纯软件的模式。


谈到落地的制约因素,我认为有两个先决条件,一是框架得完备,只用一个模型落地显然不可能,这也是 AI 落地难的原因之一。国内有很多人说,找到一个开源的模型改改就行了,我可以很明确的说这不行,模型数量不是那么简单的事情。此外,需求本身千变万化,大家对于 AI 的能力往往有过高或过低的估计,总之这种估计不准,会导致将它收敛成的产品或解决方案真正能用起来比较难。


我们判断,到 2023 年左右,就可以看到数字人在国内以及全球范围内形成比较规模化的落地。它不是一个很久远的事情。


李士岩: 我们判断,SaaS 和订阅制,将会成为数字人行业爆发的主流范式。这本质上是在于,数字人应用价值体现的一个很重要的场是内容生产。而内容生产的的特征是,场景是收敛的,一旦这个场景特征是收敛的,它就一定会向标准化的产品发展,对于标准化的产品,一个最合理的商业模式就是与客户共赢,就是 SaaS 化。我们认为未来的发展方向一定是 SaaS 化。


另外一个比较好的商业模式,我们认为是有利于数字人核心技术在不同领域内扎根、深耕应用的场景下的企业定制化服务。因为只有在这个场景下,才能够将数字人的技术具体地深入应用到具体的行业里,才能够让数字人在垂类的行业里产生更多价值。与此同时,也通过这种商业化的形式与企业一起来锤炼某个细分领域内的数字人最核心的技术。


InfoQ 第十问:目前在国内外,数字人发展到什么阶段了?国内和国外的发展情况有什么不同?如何看待其在接下来 3-5 年的发展趋势?


李笛: 从市场深化的角度看,无论是基于 IP 运营的,还是基于动画制作的,还是 AI Being 的,国内和国外现在的发展阶段都差不多,没什么差别。甚至在某些使用领域,国内比国外发展还快。其实中国人工智能的普及率比欧美国家快很多。从技术角度看,现在,虚拟数字人相关的技术,在国内和国外本质上也没有什么差距。差距在于原生的创新是由谁驱动的,国内的原生创新推动还是不足。


接下来会朝着通用化的趋势发展。我们重点关注通用性数字人存在的必要。市场确实存在一些需求,这种需求最好是广泛的需求,而不是专用的需求,以前我们利用 AI 赋能各行业,常把 AI 锁定在不同的垂直领域,比如医疗 AI、金融 AI...把 AI 细分到垂直领域的方向很难让 AI 通用化起来。另外一个趋势是普及,让 AI Being 更多出现在人们周围。


李士岩: 数字人就两大场景,一是服务场景,一是演艺场景,这两个场景在国内发展地更快。因为我们在国内有非常好的、庞大的需求基础。另外我们看到,国外发展更多的是在演艺场景,如虚拟偶像、虚拟演唱会,还有虚拟会议等。相较服务,国外在演艺方向的发展更迅猛一些。在国内,是服务和演绎并驾齐驱的状态。未来 3-5 年,我们认为,通过不断降低服务门槛,加快交付效率,数字人在文娱、金融、广电等行业的渗透率,一定会逐步提升。


数字人的发展与空间计算平台(硬件)的发展息息相关。空间计算平台的典型代表是 VR 和 XR,如果这些设备的渗透率达到一定程度,那它所激发的需求就在于我们每个人。如果想进入到空间计算平台的软件或信息世界中,我们每个人都必须有一个三维的虚拟化身,它是进入这些平台的必要条件。


所以,数字人会由原来在特定企业、特定行业里需要的一项营销和服务技术转变为一个人们进入三维数字世界中的必备条件,无论是我们普通人还是有 IP 价值的明星、名人。他们如果想进入这个世界,产生应用,创造价值,就必须有自己的虚拟化身。


在未来,我们的判断是,以 VR 和 XR 为核心的空间计算硬件的出货量,在接下来 3 — 5 年间应该会达到一定的级别,我们认为这是一个临界点。那时,数字人会因为空间计算平台出货量的提升,迎来爆发式的增长。


采访嘉宾介绍:


李笛: 小冰公司 CEO,负责人工智能小冰框架系统的技术研发、产品革新及商业落地。曾任微软(亚洲)互联网工程院常务副院长、微软小冰全球总经理及微软 Bing 搜索引擎亚洲区总经理。他于 2013 年加入微软,同年创立微软人工智能情感计算框架,并于 2014 年推出微软小冰。李笛毕业于清华大学。


李士岩: 百度数字人与机器人业务负责人,从事人工智能相关产品设计、研发、运营 10 余年,主导了百度智能云机器人和数字人的早期研发与运营,形成了完备的商业化产品矩阵。设计专业背景,曾获“光华龙腾中国服务设计十代杰出青年”和 红点、Adesign 等奖项。

The End