Select Language

AI社区

数据要素产业

AI虚拟主播“小灵”背后有哪些秘密?

12-08 01:03 TAG: AI虚拟主播 人工智能

今年“五四运动”迎来一百年的生日,在中央广播电视总台主题为“我们都是追梦人”的 2019《五月的鲜花》五四晚会上为其献上一份“新鲜”大礼,百度大脑AI虚拟主持人小灵首次亮相。作为“新新”青年的代表,小灵在舞台上赚足了眼球,既能通过人脸识别技术与嘉宾互动,又有极强地控场能力。

小灵作为3D立体虚拟主持人,糅合了百度大脑的语音、视觉、大数据,以及AR等多重技术,其中最引人注目的是“唇动技术”。小灵的唇动技术,基于大量的面部特征数据学习,辅之以人工智能和深度学习技术而形成的。小灵优秀的主持功力背后,究竟有哪些技术作为支撑呢?虚拟主持人将会有多大的发展前景呢?接下来我们细细剖析!

“小灵”台上一分钟,AI幕后做了哪些“十年功”?

小灵在从漫天飞舞的鲜花中走出来,站在主持人小尼和王俊凯中间热情地与观众互动,活动过程中能够发表自己的观点,看似简单的行为,背后少不了海量的数据支持和超强的人工智能技术运用。

首先,不得不提小灵的“唇动技术”。人说话嘴唇会自然而然地跟着运动,我们习以为常的事情对于AI虚拟主持人便没有那么简单了。小灵想要达到能够在说话的时候像人一样自如地开合嘴唇,她一定要做好充足的准备。第一项准备事宜便是面部数据的搜集,每一项人工智能技术的产生都需要大量的数据作为基石。基于对海量的面部数据进行深度学习加之语音合成技术,便形成了我们看到的人工智能虚拟主持人“小灵”在晚会上能够“真实唇动”。

其次,人脸识别技术更是现场最大的亮点。在与主持人小尼互动的时候,小尼想借用00后爱看的动画片来掩盖自己的真实年龄时,小灵并没有“上当”。小灵通过人脸识别技术采集了小尼的人脸信息,并利用知识图谱清楚地知道小尼的年龄。在小尼企图用《喜羊羊与灰太狼》来欺骗小灵时,小灵迅速运用自己的“超级大脑”知识图谱来反驳他说,《黑猫警长》、《葫芦兄弟》才真正属于他的年代。人脸识别+知识图谱的技术让小灵能够在现场做到随机应变,与此同时人脸识别技术还运用到了与嘉宾互动的环节。今年晚会上有一个有趣的测“花”活动,小灵通过人脸识别技术便可测出你是什么“花”。

除了人脸识别技术,还有AR、大数据、语音识别等技术运用在小灵身上。“台上一分钟,台下十年功”,小灵虽然第一次登台,却能够落落大方、对答如流离不开各类AI技术的成熟与灵活配合。

AI虚拟主持人究竟能走多远?

其实,小灵并不是首位AI人工智能主持人,在今年两会期间搜狗与新华社联合推出的“新小萌”和科大讯飞推出了“小晴”两位人工智能虚拟主持人。两会期间推出的两款均可以找到原型,如新华社推出的“新小萌”是以新华社主播曲萌为原型。这类虚拟主持人通常是真人输入语音,随后对声音进行标注和机器进行深度学习,以此构建出其发音声学模型,在此基础上,输入任何文本便可进行语音合成,进而实现在线播报。本次五四晚会亮相的“小灵”是以二次元形象示众,没有明确的原型可以寻觅。与此同时小灵需要在舞台上与其他主持人和嘉宾互动,和在线播报相比,小灵不仅要运用到语音识别的技术还要具备能够在短时间内进行大数据运算的能力。对于虚拟主持人来说,技术发展有了进一步的提升,但很多人依旧存在疑惑,虚拟主播要来抢“播音员”的饭碗吗?

人工智能作为一项通用技术,可以为了各行各业出现的问题提供解决办法,对于主持人行业来说也不例外。首先,虚拟主播可以节省大量人力成本。科大讯飞推出的“小晴”精通多种语言,可以在中文、日语、英语、韩语等多种语言中随意切换,并且发音准确,十分专业。如何能够将该项技术可以广泛普及,在对外宣传的节目中,专业、标准的发音能够极大地提高传播效果。此外,虚拟主播能够在恶劣的环境中完成播报。众所周知在各大事件发生时,记者总是要冲在第一线,掌握最新信息播报给大众,但优势环境过于恶劣或者人力难以到达的时候,虚拟主播或许能够派上用场。在战火纷飞的战场通过无人机获取最新情况后,虚拟主播可以实时播报新闻;地震、洪水等自然灾害发生后,记者难以最先达到事故发生区,虚拟主播便有了用武之地。

虚拟主播随着人工智能技术的不断发展,可以不断解决行业内存在的问题。至于虚拟主播究竟能不能取代人类的担忧,依旧是“杞人忧天”。人工智能技术是让人类可以从繁杂、无聊的工作中解脱出来,而不是取代人类,真正有创造性的工作依旧需要人类自己完成。

小灵爆红背后,少不了“百度大脑”的助力

我们已经了解了小灵在舞台上出色的表现运用了哪些人工智能技术的同时,也清楚虚拟主播的未来存在着巨大的发展前景。但是一个产品背后的技术是错综复杂的,能够让技术在短时间内高效的工作少不了一个强大的支撑,小灵的靠山便是“百度大脑”。

百度大脑是百度 AI 核心技术引擎,包括视觉、语音、自然语言处理、知识图谱、深度学习等AI核心技术和AI开放平台,对内支持百度所有业务,对外全方位开放。目前,百度大脑AI开放平台开放了171项技术能力,已吸引超过110万开发者使用。除了百度拥有AI开放平台外,腾讯、阿里、网易、英特尔、亚马逊、科大讯飞均设立了AI开放平台。



目前,国内的人工智能开发平台分为两类,要么有强大的实力开发底层技术,要么在细分领域有雄厚的技术支持。BAT巨头的开放平台开放技术丰富且底层技术多,而讯飞AIUI开放平台、FACE++人工智能开放平台等均是基于自身优势不断挖掘。

但是,目前的AI开放平台存在着两大问题,一是AI技术开放平台的业务内容多于技术内容,这便与设立AI开放平台的初衷背道而驰;二是开放平台市之间缺少统一的技术标准和规则,导致底层技术差别不大,造成人力和物力的浪费。例如,百度开放平台会涉及到语音技术,而讯飞AIUI开放平台的语音技术更为深入和全面,两者建立合作更为高效。

解决这两大问题,AI技术开放平台才能更好地发挥其作用。人工智能开放平台是一个“桥梁”,一头它连着开发者和研究机构,可以帮助平台技术不断实现迭代;另一头连接着企业,可以将AI技术赋能到各行各业。根据清华大学发布《中国人工智能发展报告2018》显示,截至到2018年6月,全球共监测到人工智能企业总数达4925家,其中美国人工智能企业数2028家,位列全球第一,中国(不含港澳台地区)人工智能企业总数1011家。2017年全球人工智能投融资总规模达395亿美元,融资事件1208个,其中中国的投融资总额达到277.1亿美元,融资事件369个。中国Al企业融资总额占全球融资总额70%,融资笔数达31%。通过企业和行业投资的现状来看,人工智能技术平台的发展前景广阔,因此标准的制定将是迫在眉睫。

在感叹AI为我们生活带来各种惊喜的时候,我们更要时刻保持一个探索的心,不断追求技术革新,AI技术开放平台正是一个很好的路径。目前,中国人工智能企业的发展已经回归理性,并且今年两会提出“智能+”的理念,要求中国的人工智能发展将要成为全国科技、经济、社会发展和国家安全的全面支撑,AI技术开放平台的日渐成熟是必然之路。