你想克隆一个自己吗?

动作捕捉 2023-05-03 5678


你想克隆一个自己吗?  第1张


?你想克隆一个自己吗?不,不是真实世界的克隆,我们指的是虚拟世界的克隆。


这篇文章是往期文章 他们如何做到3.9亿粉丝,而又将何去何从?的延伸,于文中我们推测,未来一定是虚拟偶像平民化、全民虚拟化,所以,将一个人的样貌与言行投射到虚拟世界里创造一个全息的虚拟形象是未来技术上要解决的难题。


就目前的技术,一个简单的虚拟形象,通过语言与歌唱能力的赋能,再到动作的赋能,就可以变得活灵活现,仿若真人一般;但是从二次元发展来的虚拟偶像在形象方面终究是虚拟感太强,我们是否有办法让虚拟偶像完全使用某个真人的形象呢(当然可以加一些美颜、拉腿)?与此同时,能否让虚拟人具有自己的思维和行为模式,而不是背后还需要真人去扮演呢?


对于上面两个问题,答案是肯定的,这就是我们今天要讲的数字/虚拟克隆人技术。


这种技术能满足两方面需求:一方面,我们对于3D全息形象的需求。因为我们的技术一直在从2D图片视频向3D,在向VR、AR转移,在3D世界我们需要3D的形象,而不仅仅是一张图片,数字克隆人的形象是全息的,能满足这种需求。


另一方面,我们希望这个虚拟形象可以像一个克隆人一样替代本人按照预先设定好的命令去完成一些任务,比如唱歌、跳舞、表演、开会、主持节目等,不需要真人在幕后表演,甚至能替代真人的实际工作。他们虽不具有独立的意识,但是可以具有人们期望的某种思维逻辑和知识体系,这种逻辑思维和知识体系可以是模仿某个人的,也可以是某种意义上最优的。


2D内容过渡到3D这个需求我们不难理解。对于第二个需求,我们在这里举几个简单的例子让读者感受下制造虚拟克隆人带来的好处:


淘宝卖货一哥李佳琦不用本人直播,而是让他的虚拟数字克隆人模仿他的声音,表情和卖货套路直播带货,24小时不间断的直播,不仅不会觉得累,而且不会出现失误


你想克隆一个自己吗?  第2张

直播到懵圈的李佳琦


影视演员迪丽热巴拍戏不需要本人拍戏,由她的虚拟数字克隆人代她拍戏,拥有她的容颜,神情,特有肢体语言,同时24小时在不同的点、不同剧组拍不同的戏,不会疲惫,拍危险场景的戏的时候不会有危险,拍激情戏的时候也不用有真实的接触,少一些为艺术献身。。。


你想克隆一个自己吗?  第3张

为艺术“献身”的胖迪


著名主持人的虚拟替身可以同时在不同地点主持不同的节目;热情大方的虚拟客服可以无所不知、随时随地、不厌其烦地为不同人群回答各种五花八门的问题;敬业的记者也不必长时间的在危险的现场进行实况播报;等等等等。


你想克隆一个自己吗?  第4张

冒着生命危险在台风现场进行实况报道的记者


听起来是不是很诱人?当然现在的技术还不能完全达到这样的水平,但是显然已经在朝这个方向发展了


我们先看一个简单的例子,虚拟主持人--小小撒。下图的虚拟主持人是主持人撒贝宁的“数字克隆人”, 有着和本人一样的外表,相貌,相仿的肢体动作,以及说话时的唇形和表情。虽然技术还有些拙劣,看着还是有些别扭,但是足以表达“数字克隆人”的含义,也让人有了想象的基础。


你想克隆一个自己吗?  第5张

虚拟主持人小小撒在“谈笑风生”


这一位虚拟主持人不仅和真人很相似而且还具有多个优点

1)不知疲倦,不会抱怨,没有失误,行为完全可控;

2)复制几乎零成本,可分身无数,不同舞台同时工作;

3)换服装,换妆容也是几乎零成本,而且可以轻松美颜;

4)等等等等。


虽然目前的技术还不能让“数字克隆人”达到和真人无论从肢体语言,相貌还是表情一模一样,但足以让人看到TA巨大的价值与商业前景,并给了人们一个想象空间足够大的想象的方向,而技术的成熟只是时间上的事情。


不谋而合,国外虚拟主持人相关技术和案例也在逐渐兴起。大家感觉国内和国外的虚拟主持人谁更“好”一些呢?


你想克隆一个自己吗?  第6张

同台主持的两个虚拟主持人


当然,除了虚拟主持人之外,“数字克隆人”还有很多应用领域。


诸如前面提到的,虚拟偶像起源的领域-演唱,下图是邓丽君的“数字克隆人”在央视节目《经典永流传-第二季》上与一位11岁小姑娘同台演唱邓丽君经典曲目《水调歌头》。通过数字克隆人技术,我们在听到已故演唱家邓丽君美妙歌声的同时还能欣赏到她的深情表演,而这相隔36年对经典的再次传唱与节目本身的主题“经典永流传”又是多么的契合


你想克隆一个自己吗?  第7张

相隔36年邓丽君与11岁小姑娘传唱经典《水调歌头》


无独有偶,人们似乎发现了数字克隆人技术在克隆保留珍贵人物信息,“复活”已故之人方面有巨大价值,所以就在前不久,一个韩国团队拍摄了一个名为《遇见你》的感人纪录片,片中一位名为智胜的母亲通过VR(虚拟现实)眼镜在虚拟世界里见到了她患病离世小女儿娜研。


技术团队通过VR技术与数字克隆人技术让她们母女重逢,让这位痛失爱女的智胜能够陪伴小女儿娜研玩耍并给她过了本无缘再有的生日。因为母亲智胜在小女儿娜研离世后三年里一直没有走出来,日渐憔悴,所以导演在片中结尾处让娜研化作一只蝴蝶轻快的飞往远方,意在告诉智胜娜研已经飞走了,请好好振作起来。纪录片一经上映,便引起轰动,好评如潮,引无数人泪目,所以谁又能说科技没有温度,不能以温情感人呢?


你想克隆一个自己吗?  第8张

感人纪录片《遇见你》母亲智胜与女儿娜研的数字克隆人重逢


回到影视演员迪丽热巴的例子上来,不管是在拍摄具有危险的剧情和镜头还是所谓的为艺术献身,虚拟克隆人都能发挥极大地价值。我们不妨想象一个极端的例子--情色演员


对情色演员进行数字克隆并请虚拟克隆人出演影片绝对是个绝妙的点子。一方面由于情色演员主要在展示色相,而色相是真人的还是使用虚拟克隆出来的其实对于观众来说差别不大,并且虚拟克隆人换装以及化妆更容易,所以情色演员的虚拟克隆人在基本面上不输真人。另一方面,情色演员的虚拟克隆人拍摄影片可以省去真人间的肢体接触,这对情色演员简直是一种莫大的保护。从商业的角度来考虑,请虚拟克隆人拍摄可以大大缩短拍摄时间以及减少拍摄成本,并且不会受档期干扰,也是性价比很高的一种选择。不过笔者认为,撇开其他的不说,光是只需要数字克隆一次就可以避免肢体间的接触,这种对演员本身的保护的意义就值得科研人员快马加鞭的研发数字克隆人技术。(这个例子我们就不放图了, 哈哈哈)


看到这里相信其实很多读者对数字克隆人这个概念与它的价值和商业前景已经有了一个基本认知。如果读者对技术软科普感兴趣,可以继续往下看;不感兴趣则可以跳到文末看这一期的问题。


技术软科普


数字克隆本质上是模仿或者复制,而模仿或者复制的本质是学习。所以,对于模仿和复制这样的任务,人工智能领域的深度学习技术有很大的用武之地,它也是目前数字克隆人技术的核心。


深度学习技术简单的讲就是给计算机很多很多数据和信息,并告诉它这些数据和信息哪些是“有用的”、“好的”,让计算机自己去训练自己保证在遇到新的数据和信息时候,它能按照人们之前定义的“有用”和“好”做出甄别和选择。


回到数字克隆人技术上来,我们需要想一下,数字克隆一个人到底需要克隆哪些部分。虚拟克隆是否成功以及克隆的好坏与否得由一个正常人去评价。一个正常人则会通过他的感官和逻辑去感受并判断,这包括眼,耳,鼻,舌,身,意,六个层面


从这六个层面上看,满足眼或者说视觉的需求,需要克隆一个人的样貌,表情,肢体语言等;满足耳或者听觉的需求,需要克隆一个人语言能力,包括语音语调,说话风格等;因为数字克隆人是虚拟的,所以不必满足鼻(嗅觉),舌(味觉),身(触觉)三种正常人感官的需求;而满足意或者说思维逻辑方面的需求,需要克隆一个人的思维模式、知识体系、价值观等诸多精神层面的东西。


好了,想数字克隆一个人我们只需要聚焦在这三点上面:语言能力,形象,思维逻辑。


语言能力包括能听懂别人的话--语音识别技术,能说出具有特定语音语调语气的话--语音合成技术,以及能理解别人说的话的含义--自然语言处理技术。当然,理解别人的话也算是思维逻辑的一部分。这三种技术很多大公司都在做,并且我们身边已经出现了很多产品,比如iphone的Siri,小孩用的教育类机器人,各种厂家出的智能音箱等。这类型产品的特点是它能听懂并理解你说的话,自己按照自己的逻辑进行“思考“,然后使用某个人,比如林志玲或者郭德纲,的声音回复你。使用过类似产品的读者,你感觉目前的语言能力克隆技术合格吗?


形象包括样貌,表情,肢体语言等。三维的样貌可以采用人体三维重建技术获取,跟前一期讲虚拟偶像技术(链接)的光学或者视觉动捕方案类似,但是三维重建要比动捕捕捉的信息多的多,力求不错过任何一个细节,而三维重建的好坏也体现在细节的重建上,比如是否能捕捉眼睫毛或掌纹等。人体三维重建工作室大概是这样的:


你想克隆一个自己吗?  第9张

人体三维重建工作室


表情的克隆就相对难了些,因为深度学习技术需要大量的数据,所以需要采集一个人各种各样表情,比如微笑,坏笑,大笑,愤怒,怨恨,委屈等等,这本身就是件费时费力的事情,而且还需要对这些表情进行细致的归类以及将他们与可能的心理状态联系起来。而且表情属于细致入微的东西,前面也提到了,细节的处理是相对难的,这就让表情的克隆难上加难。


肢体语言的克隆和表情的克隆类似,因为表情实际上是面部语言,这样两者的技术路线和思路基本一致。不同的是,肢体语言相比面部语言的种类和自由度大了些,但是需要处理的细节。


再次感受下正在通过肢体语言表达情绪的虚拟克隆人小小撒:


你想克隆一个自己吗?  第10张

虚拟克隆人小小撒通过肢体语言表达情绪


最后一个是思维逻辑等精神层面的克隆,这一块是最难的也是目前进展最缓慢的,因为目前谁也搞不懂人的大脑到底如何运作的,同时精神层面的东西不仅无法量化,而且捉摸不透。这导致人们经常会称呼很多人工智能的产品为人工智障。但其实某种层面上讲,我们并不需要完全克隆一个人精神层面的东西,甚至所有逻辑思维能力都不需要,只需要关注并克隆TA某一部分,某一专业领域的思维能力就可以了,比如知识问答型、客服型虚拟克隆人只需要能理解问题,搜集信息,“思考”,并作出回答即可,而知识也不用克隆,直接克隆复制整个最全的知识资料库就好了。这样可以大大简化问题,降低难度,使得对所谓思维逻辑的克隆变成可能。


综上,目前的数字克隆人技术是多种人工智能技术的综合,一个理想的,真假难辨的虚拟克隆人需要每一部分的数字克隆技术的登峰造极。距离虚拟克隆人带给我们实实在在的价值虽然还有些遥远,但未来可期。


留给读者思考的问题:

1. 如题,你想克隆一个自己吗?用来做什么?

2. 你最希望数字克隆人被应用到什么领域呢?


以上图片均来自于网络

The End