前线 | 当AI能学习腾格尔唱歌-凤凰科技-八卦帝

微信截图_20180305151218.png

iFeng科技

凤凰网科技官方账号，带你直击真相

来源：视觉中国

第六代微软小冰全新形象

7月26日，微软在北京召开了年度发布会，宣布微软小冰已经升级到了第六代，升级内容包括微软小冰情感计算框架的所有组成部分。

“微软小冰在全球拥有6.6亿用户，其中月活用户达到了1.2亿。” 微软小冰项目全球负责人、微软（亚洲）互联网工程院副院长李笛在发布会上表示，微软小冰已经从一个人工智能对话机器人发展成以情感计算为核心的人工智能框架，覆盖包括美国、中国、日本、印度和印度尼西亚五个国家的总共40多个平台。

这也是微软小冰自诞生的四年以来进行的第六次重大升级，这次主要技术升级的内容包括：

1、全新的Dual AI战略：与合作伙伴建立围绕产品和数据的生态。一方面，微软会向合作伙伴输出小冰的整体框架能力，帮助其自有AI平台的发展；另外一方面，微软小冰也可以作为其辅助AI，融入其生态环境当中。之前，微软小冰就已经成为了小米的AI音箱小爱同学和小米生态链企业Yeelight的语音助手的双AI系统之一。

2、全新的合作与升级：与网易云音乐合作的小冰电台已经上线，帮助网易云音乐打造了两个专属AI人物多多和西西；与米家生态链企业Yeelight进一步在内容上合作，为其提供2000万首音乐曲库和儿童故事，还升级了全双工语音技术；入驻华为手机，内置于华为手机内的微软小冰已经上线，用户在负一屏可以唤醒；此外还有与腾讯QQ和Line的合作。

3、核心对话引擎和实时视觉感官的升级：此前微软小冰基于生成模型，具备了脱离语料库自创回应的能力，而基于此前的模型，共感模型可以让微软小冰提升对于对话内容、领域和节奏的控制力，把对话引导向其所期望的方向；此外，在去年全双工语音的基础上，微软小冰具备了新的感官——融合共感模型、全双工语音和实时视觉。在现场，微软的体验设备中，小冰通过视觉和语音的实时连续交互，指挥用户完成了面容检测。

微软小冰，从人工智能对话走向人工智能创造

基于这些技术升级，微软小冰在人工智能创造上的能力进一步提升。在此之前，小冰就已经具备了多种身份——电台主播、节目主持人、诗人、新闻评论员、歌手等。

2017年5月，小冰发布诗集《阳光失了玻璃窗》，共收录139首诗，这也是第一部完全由人工智能创作的诗集。

小冰的最近一次创作是在2018年5月17日的知乎盐Club上，她创作并演绎了活动的主题曲《我知我新》。她的这首最新单曲随后被发布在网易云音乐上。也是借着本次单曲发布，微软小冰的演唱深度学习模型完成第四次重大升级，主要针对气息模型、示唱预测、增控生成、作词模型共四大方面，开始接近人类歌手表现，但生成调教用时仅17分钟。

此外，她还进驻了重庆交通广播、河南交通广播、北京文艺广播等28个广播电台成为主播，并加盟湖南卫视等成为21个电视台主持人。“每天早上6点到9点，小冰要同时参加7档电台节目。”李笛说，这就是人工智能的好处，身兼多职，没有怨言，也不会喊累罢工。

根据微软官方的数据，截止目前，小冰自动生成的儿童有声读物已经获得超过400万小时的收听量，覆盖国内超过90%的儿童早教机器人和80%在线收听平台；小冰与Bing搜索引擎结合的垂直行业解决方案在超过15个媒体平台落地。

最令人惊喜的是小冰在全能型歌手的路上越走越远。微软宣布将小冰的形象替换为一个全新的3D外形，这个最新的3D形象在舞台上以全息形式登场，向全场嘉宾进行自我介绍并且演绎了一首歌曲。她展示了全新的V4版本的DNN人工智能歌声合成技术，帮助她在唱法唱功上有个质的飞跃。

对比她之前唱过的《隐形的翅膀》，明显能感受到她的进步。

第四代微软小冰的演唱的水平相比之前有了很大的提高，改善了机器人语音的生硬音效和机械发音，也是她摆脱机器人趋于人类歌手一个转折点；到了2017年，第五代小冰升级了声音模型，她的声音更加自然贴近人类，最后还陆续发布了自己的单曲，成为真正的“创作型”歌手。

而第六代小冰采用了微软最新发布的第四版人工智能歌曲DNN模型，可以迅速学习并吸收不同人类歌手的演唱风格，并在演唱时自动选择风格并运用了。小冰就在现场演绎了腾格尔版本的《隐形的翅膀》。

微软提供的一张第三版小冰和第四版小冰的声音波形对比图上，如果仔细去观察微软小冰的歌唱技巧，发现会有一小部分的不同：在每个声音波形连接处会有很轻微的声音进入。借助于最新版本的声音模型，这其实是微软小冰已经自己学会了像人类歌手一样换气、呼吸；以及在声音波形开始和退出的部分，声音不仅不那么生硬，还有了声音渐进和渐出的效果。

第四版人工智能歌曲DNN模型还能让小冰复制并吸收特定人类歌手的全部演唱特质，比如嗓音、音律等，使她具备完全代替原人类歌手的人工智能化工作。

“大约在冬天，我们计划给小冰带来一个更具颠覆和创造性的改变——创造一种人类未曾有过的声音。”微软小冰首席科学家表示。

在李笛看来，人工智能（不管是对话式机器人还是语音助手）最大的价值不在于自我学习和迭代，而是必须要在实际中转起来，这样才能验证产品形态和方向是否正确。所以在接下来的时间，微软为小冰成立了“小冰工作室”，希望将小冰的人工智能平台能力向合作伙伴输出，在给予合作伙伴人工智能技术能力的同时，也能帮助小冰迭代更多的模型，形成正向的循环。

沈向洋：要么引领趋势要么跟上趋势