您的位置:首页 > 科技 >

「克隆」新华社女记者 全球首位3D AI合成主播由搜狗推出

2020-05-27 10:27:49 来源: 机器之心

或许在不久的未来,你再也分不清视频中的主持人,究竟是真人还是虚拟人,而这一天正在到来。先看这张图,主持人迈着轻快的步伐走进演播室,

或许在不久的未来,你再也分不清视频中的主持人,究竟是真人还是虚拟人,而这一天正在到来。

先看这张图,主持人迈着轻快的步伐走进演播室,面带微笑,姿态端庄得体,动作自然。

「新小微」播报时的面部表情

逼真否?如果不告诉你,你能猜到它是一个虚拟人吗?

它由搜狗公司联合新华社推出,是全球首位 3D AI 合成主播,编号「新小微」。

「逼真」大概是我们对于表现力极高的一种赞扬,比如在《霸王别姬》中,「袁四爷」看到程蝶衣出神入化的演技后,发出「虞姬再生」的感叹。搜狗 3D AI 主播又何以做到逼真?

栩栩如生的形象之下,它还是一个完全由 AI 算法实时驱动的 3D 数字人。这和那些游戏影视中依靠美术师逐帧勾画的 3D 动画人有本质不同。

两会开幕前夕,这位「新小微」已正式「上岗」,为你带来两会新闻资讯报道。

一、「高逼真」的背后

「新小微」,是一个 3D AI 合成主播。

它以新华社记者赵琬微为原型,通过超写实 3D 数字人建模、多模态识别及生成、实时面部动作生成及驱动、迁移学习等技术「熔炉」,炼就而成。

你只需要输入一段文本,它就能生成语音数据、3D 肌肉运动参数,最后通过渲染,生成一段 3D 合成主播视频,可以 360 度多机位多景深呈现。

从效果上来说,3D AI 合成主播给人的最大印象便是高逼真,它较好的还原了真人的发肤、表情;在特写镜头下,连头发丝和皮肤毛孔都清晰可见。

 


其次是灵活性、可塑性更强,3D AI 合成主播可以走动、转身、可以摆出各种复杂的动作和姿态,具备在更广阔空间使用的潜力。

透过 3D AI 合成主播技术实现过程,我们可以得知它为何拥有如此逼真的效果。

首先基于真人原型采集海量数据:原型戴着数据采集头盔,几百个摄像头会对其身体各个部位进行全方位「打点」扫描,采集每一处细节,并对其多种形态的表情和动作进行细致入微地捕捉记录。

 


其次,搜狗采用了行业领先的扫描还原算法,以及面部肌肉驱动、表情肢体捕捉等技术,生成高逼真度的 3D 数字人模型。

然后,通过搜狗的 AI 算法对 3D 数字人模型进行实时驱动、渲染,使其面部表情唇动、肢体动作和语言表达能力达到一个较高的度契合。

搜狗 AI 交互技术部总经理陈伟谈道,3D 合成主播的难点在于如何做到高逼真度。为了让模型效果更逼真,搜狗采集了更为精细的数据,并进行精准标注。

另一方面,搜狗采用更符合人体生理结构的肌肉模型,让机器去学习肌肉的运动规律,从而让表情、动作之间的过度更加自然。

搜狗一位产品经理也谈道,为了让「新小微」更加逼真,他们花了很多精力去了解超写实的制作行业,如何把一个真人的动作映射在模型上,并反过来改善 3D 制作行业的模型,让模型驱动起来更加逼真。

为此,从去年 10 月到今年 5 月,搜狗技术团队投入近半年时间,完成这一挑战。

二、完全 AI 驱动的 3D 数字人

随着游戏、影视的发展,逼真的 3D 数字人似乎早已存在,搜狗为何敢号称是全球首个 3D AI 合成主播?

仔细观察你会发现,3D AI 合成主播和 3D 数字人有着本质不同,前者是完全基于 AI 算法实现驱动,而非人工驱动。

具体来说,3D AI 合成主播靠 AI 算法实时驱动,输入一个文本就能输出一个视频,往往生成一个 1 分钟的视频,仅只需要 1 分钟,相比人工驱动,几乎可以看作实时生成。

而游戏、电影行业多是靠人工驱动来完成一个超写实的 3D 模型。比如在一个 10 人构成的动画中,往往要对这 10 个演员进行扫描、动作捕捉、面部捕捉,进行真人与卡通人物绑定,还需要对他们的声音进行采集等等,需要美术师一帧一帧勾画出来,耗费巨大的时间成本。

在游戏场景中,一个 1 分钟的转场动画,往往要一个动画师工作一天半。可以说,3D 数字人的制作是一个劳动力密集型工作。

其次,二者 3D 模型的制作技术不同。

在 3D 设计中,很多做写实类的 3D 模型多是采用 Blendshape 来做的,其逻辑在于通过一个极限表情乘以不同系数,得到生成的表情,但往往效果较为粗糙,表情之间的过度也不够流畅自然。

而搜狗采用肌肉模型、肌肉绑定来做 3D 模型,一方面它使 3D 人物的动作更加逼真;另一方面肌肉模型中每一个肌肉点的运动,都会连带很多面部脸谱协同运动,整体看起来自然度会更高。

从面部表情到肢体动作的细节程度,搜狗 3D AI 合成主播达到了不亚于一些影视作品及游戏 NPC 的写实度。

此外,搜狗还将迁移学习运用到 3D AI 合成主播中,通过对一般人动作的预训练,仅需真人原型近 1 小时的数据,就合成了如今的「新小微」。

AI 技术的加持,使 3D AI 合成主播在产出视频上成本更低、效率更高。

而在 3D 设计中,制作一个小时完整的 3D 写实度视频,除了耗费大量时间外,往往要花费成百上千万人民币。

可以预见,3D 制作行业,AI 驱动大有可为。

三、「进化中」的搜狗分身

还记得搜狗在 2018 年推出的首个 AI 合成主播吗?它是一个 2D AI 合成主播,以新华社主持人邱浩为原型。

 


如今推出的「新小微」是 3D AI 合成主播。你可以把它们看做一对「兄妹」,它们共同的父母是「搜狗分身」。

搜狗分身与其说是一项技术,不如说是一个框架、一款产品。它所要做的就是「克隆」(合成)人类的声音、面部表情、动作等,最终变成一个虚拟助理,更好的帮助人类表达。

这也契合了搜狗一直以来的使命——让表达和获取信息更简单。

经过 1 年半的迭代,目前搜狗分身具备了对话交互、多语种播报等能力,在媒体、客服、司法等领域都得到了应用。

需要指出的是,2D AI 合成主播和 3D AI 合成主播是搜狗分身下的两条并行发展路线。

前者的优势在于真实性、逼真度更高,但灵活性略显不足;而后者的灵活性、可塑性更强,应用领域更广。二者在应用场景上具有一定互补性。

陈伟称,搜狗会在 2D、3D 技术上一起往前推进。

从 2D AI 合成主播到 3D AI 合成主播,从表达式到对话交互,搜狗分身正在不断进化。

搜狗分身也在不断进入垂直领域,围绕特定领域进行知识计算,积累「智慧」高度。

一个有形象、多模态的虚拟个人助理正在逐渐形成。

首届「马栏山」杯国际音视频算法大赛正在火热进行中。大赛聚焦图像和推荐、画质优化三大领域,设置包括视频特定点位追踪、视频推荐、画质损伤修复三大赛题。优秀参赛者不仅可获得奖金,获奖解决方案还有机会被应用于芒果 TV 核心领域,在校学生还将可能加入芒果 TV「青芒计划」,发放「special offer」。

关键词: 搜狗

精选 导读

募资55亿港元万物云启动招股 预计9月29日登陆港交所主板

万科9月19日早间公告,万物云当日启动招股,预计发行价介乎每股47 1港元至52 7港元,预计9月29日登陆港交所主板。按发行1 167亿股计算,万

发布时间: 2022-09-20 10:39
管理   2022-09-20

公募基金二季度持股情况曝光 隐形重仓股多为高端制造业

随着半年报披露收官,公募基金二季度持股情况曝光。截至今年二季度末,公募基金全市场基金总数为9794只,资产净值为269454 75亿元,同比上

发布时间: 2022-09-02 10:45
资讯   2022-09-02

又有上市公司宣布变卖房产 上市公司粉饰财报动作不断

再有上市公司宣布变卖房产。四川长虹25日称,拟以1 66亿元的转让底价挂牌出售31套房产。今年以来,A股公司出售房产不断。根据记者不完全统

发布时间: 2022-08-26 09:44
资讯   2022-08-26

16天12连板大港股份回复深交所关注函 股份继续冲高

回复交易所关注函后,大港股份继续冲高。8月11日大港股份高开,随后震荡走高,接近收盘时触及涨停,报20 2元 股。值得一提的是,在7月21日

发布时间: 2022-08-12 09:56
资讯   2022-08-12

万家基金再添第二大股东 中泰证券拟受让11%基金股权

7月13日,中泰证券发布公告,拟受让齐河众鑫投资有限公司(以下简称齐河众鑫)所持有的万家基金11%的股权,交易双方共同确定本次交易的标的资

发布时间: 2022-07-14 09:39
管理   2022-07-14

央行连续7日每天30亿元逆回购 对债市影响如何?

央行12日再次开展了30亿元逆回购操作,中标利率2 10%。这已是央行连续7日每天仅进行30亿元的逆回购缩量投放,创下去年1月以来的最低操作规

发布时间: 2022-07-13 09:38
资讯   2022-07-13

美元指数创近20年新高 黄金期货创出逾9个月新低

由于对美联储激进加息的担忧,美元指数11日大涨近1%创出近20年新高。受此影响,欧美股市、大宗商品均走弱,而黄金期货创出逾9个月新低。美

发布时间: 2022-07-13 09:36
资讯   2022-07-13

美股三大股指全线下跌 纳斯达克跌幅创下记录以来最大跌幅

今年上半年,美股持续回落。数据显示,道琼斯指数上半年下跌15 3%,纳斯达克综合指数下跌29 5%,标普500指数下跌20 6%。其中,纳斯达克连续

发布时间: 2022-07-04 09:51
推荐   2022-07-04

融资客热情回升 两市融资余额月内增加超344亿元

近期A股走强,沪指6月以来上涨4%,融资客热情明显回升。数据显示,截至6月16日,两市融资余额1 479万亿元,月内增加344 67亿元,最近一个半

发布时间: 2022-06-20 09:41
资讯   2022-06-20

4个交易日净买入超百亿元 北向资金持续流入A股市场

北向资金净流入态势延续。继6月15日净买入133 59亿元后,北向资金6月16日净买入44 52亿元。自5月27日至今,除6月13日以外,北向资金累计净

发布时间: 2022-06-17 09:37
推荐   2022-06-17