前线 | 当AI能学习腾格尔唱歌

前线 | 当AI能学习腾格尔唱歌

iFeng科技 内地男星 2018-07-28 10:07:57 449

iFeng科技
凤凰网科技官方账号,带你直击真相
来源:视觉中国





第六代微软小冰全新形象

 

7月26日,微软在北京召开了年度发布会,宣布微软小冰已经升级到了第六代,升级内容包括微软小冰情感计算框架的所有组成部分。

 

“微软小冰在全球拥有6.6亿用户,其中月活用户达到了1.2亿。” 微软小冰项目全球负责人、微软(亚洲)互联网工程院副院长李笛在发布会上表示,微软小冰已经从一个人工智能对话机器人发展成以情感计算为核心的人工智能框架,覆盖包括美国、中国、日本、印度和印度尼西亚五个国家的总共40多个平台。

 

这也是微软小冰自诞生的四年以来进行的第六次重大升级,这次主要技术升级的内容包括:

 

1、 全新的Dual AI战略:与合作伙伴建立围绕产品和数据的生态。一方面,微软会向合作伙伴输出小冰的整体框架能力,帮助其自有AI平台的发展;另外一方面,微软小冰也可以作为其辅助AI,融入其生态环境当中。之前,微软小冰就已经成为了小米的AI音箱小爱同学和小米生态链企业Yeelight的语音助手的双AI系统之一。

 

2、 全新的合作与升级:与网易云音乐合作的小冰电台已经上线,帮助网易云音乐打造了两个专属AI人物多多和西西;与米家生态链企业Yeelight进一步在内容上合作,为其提供2000万首音乐曲库和儿童故事,还升级了全双工语音技术;入驻华为手机,内置于华为手机内的微软小冰已经上线,用户在负一屏可以唤醒;此外还有与腾讯QQ和Line的合作。

 

3、 核心对话引擎和实时视觉感官的升级:此前微软小冰基于生成模型,具备了脱离语料库自创回应的能力,而基于此前的模型,共感模型可以让微软小冰提升对于对话内容、领域和节奏的控制力,把对话引导向其所期望的方向;此外,在去年全双工语音的基础上,微软小冰具备了新的感官——融合共感模型、全双工语音和实时视觉。在现场,微软的体验设备中,小冰通过视觉和语音的实时连续交互,指挥用户完成了面容检测。

 

微软小冰,从人工智能对话走向人工智能创造

 

基于这些技术升级,微软小冰在人工智能创造上的能力进一步提升。在此之前,小冰就已经具备了多种身份——电台主播、节目主持人、诗人、新闻评论员、歌手等。

 

2017年5月,小冰发布诗集《阳光失了玻璃窗》,共收录139首诗,这也是第一部完全由人工智能创作的诗集。

 

小冰的最近一次创作是在2018年5月17日的知乎盐Club上,她创作并演绎了活动的主题曲《我知我新》。她的这首最新单曲随后被发布在网易云音乐上。也是借着本次单曲发布,微软小冰的演唱深度学习模型完成第四次重大升级,主要针对气息模型、示唱预测、增控生成、作词模型共四大方面,开始接近人类歌手表现,但生成调教用时仅17分钟。



 

此外,她还进驻了重庆交通广播、河南交通广播、北京文艺广播等28个广播电台成为主播,并加盟湖南卫视等成为21个电视台主持人。“每天早上6点到9点,小冰要同时参加7档电台节目。”李笛说,这就是人工智能的好处,身兼多职,没有怨言,也不会喊累罢工。

 

根据微软官方的数据,截止目前,小冰自动生成的儿童有声读物已经获得超过400万小时的收听量,覆盖国内超过90%的儿童早教机器人和80%在线收听平台;小冰与Bing搜索引擎结合的垂直行业解决方案在超过15个媒体平台落地。

 

最令人惊喜的是小冰在全能型歌手的路上越走越远。微软宣布将小冰的形象替换为一个全新的3D外形,这个最新的3D形象在舞台上以全息形式登场,向全场嘉宾进行自我介绍并且演绎了一首歌曲。她展示了全新的V4版本的DNN人工智能歌声合成技术,帮助她在唱法唱功上有个质的飞跃。

 

对比她之前唱过的《隐形的翅膀》,明显能感受到她的进步。

 

第四代微软小冰的演唱的水平相比之前有了很大的提高,改善了机器人语音的生硬音效和机械发音,也是她摆脱机器人趋于人类歌手一个转折点;到了2017年,第五代小冰升级了声音模型,她的声音更加自然贴近人类,最后还陆续发布了自己的单曲,成为真正的“创作型”歌手。

 

而第六代小冰采用了微软最新发布的第四版人工智能歌曲DNN模型,可以迅速学习并吸收不同人类歌手的演唱风格,并在演唱时自动选择风格并运用了。小冰就在现场演绎了腾格尔版本的《隐形的翅膀》。



 

微软提供的一张第三版小冰和第四版小冰的声音波形对比图上,如果仔细去观察微软小冰的歌唱技巧,发现会有一小部分的不同:在每个声音波形连接处会有很轻微的声音进入。借助于最新版本的声音模型,这其实是微软小冰已经自己学会了像人类歌手一样换气、呼吸;以及在声音波形开始和退出的部分,声音不仅不那么生硬,还有了声音渐进和渐出的效果。

 

第四版人工智能歌曲DNN模型还能让小冰复制并吸收特定人类歌手的全部演唱特质,比如嗓音、音律等,使她具备完全代替原人类歌手的人工智能化工作。

 

“大约在冬天,我们计划给小冰带来一个更具颠覆和创造性的改变——创造一种人类未曾有过的声音。”微软小冰首席科学家表示。

 

在李笛看来,人工智能(不管是对话式机器人还是语音助手)最大的价值不在于自我学习和迭代,而是必须要在实际中转起来,这样才能验证产品形态和方向是否正确。所以在接下来的时间,微软为小冰成立了“小冰工作室”,希望将小冰的人工智能平台能力向合作伙伴输出,在给予合作伙伴人工智能技术能力的同时,也能帮助小冰迭代更多的模型,形成正向的循环。

 

沈向洋:要么引领趋势 要么跟上趋势




微软全球执行副总裁沈向洋

 

在微软内部规划中,人工智能三大产品线包括infuse AI、Bing和小娜、小冰。

 

微软全球执行副总裁沈向洋表示,“人工智能对话是未来的一个重要入口,这是继Windows、浏览器和app之后的面向未来的流量入口,也符合未来机器智能化的趋势。”人工智能技术已经是微软最重要的技术投资之一,小冰则是微软“Cloud+AI”的重要组成部分。

 

在美国,包括苹果、谷歌、亚马逊等都在做对话式人工智能,中国包括小米、百度、阿里巴巴和腾讯等大型互联网公司也都在做包括语音助手和AI音箱。“这已经成为一个趋势,虽然还是很早期,但这个行业的爆发早会到来。”沈向洋说,微软很早之前就在Windows上做语音识别。

 

而后微软将小冰和小娜独立成两条不同的产品线,小娜是智能终端的任务助手,而小冰则成为兼具“IQ+EQ”人工智能机器人,这是微软的产品设计理念决定的。

 

“李笛和她的团队做小冰那么多年,在情感计算框架上,走出了一条独特的道路。”沈向洋表示,从“情商+智商”到对话式人工智能,再到生成模型和全双工语音,现在微软提的是人工智能创造,这是情感计算框架的未来趋势,也是微软正在探索的目标。

 

“在我们这个行业,引领趋势是最厉害的,其次是跟上趋势。如果不能引领趋势,那就要跟上趋势。”沈向阳说,对于微软这样的大公司来讲,目前主要的方向就是“Cloud+AI”,微软依靠云和人工智能策略成功转型。而小冰、小娜和Bing都是微软在坚定实施AI战略的体现。

 

沈向洋还以区块链为例子,他表示可能区块链在未来具有很大的商业价值,但是在现在,他并没有看到区块链领域出现了哪些革命性的应用,或者是对于社会产生了实际的价值。不过,他同时也透露,微软在云上已经提供了相关的区块链服务。


责编 | 刘考坤


目前100000+人已关注加入我们

       

       



想看深度报道,请微信搜索“iFeng科技”。

更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。

取消

感谢您的支持鼓励,我会继续努力的!

文章地址:

用户邮箱:

打赏金额:USDT

点击”去打赏“,即可进行打赏支持本文章哦

发表评论