计世网

让无处不在的“小冰”走进你的生活
作者:焦旭 | 来源:计算机世界
2019-08-16
今天,小冰更像是你我生活中的一位朋友,她可以在社交软件中、在智能家电中、在车载系统中、在随身智能设备中,她也可以在你我观看的视频中、聆听的音乐的中、阅读的诗歌中、欣赏的画作中,甚至于我们穿戴的纺织品中...

 

微软小冰(xiao ice)是什么?

你可以理性地认为,她就是微软(亚洲)互联网工程院基于2014年提出建立的情感计算框架,通过算法、云计算和大数据的综合运用,采用代际升级的方式,逐步形成向EQ方向发展的完整人工智能体系。

然而,她真的就只是像Siri、小度、小娜......一样的智能语音机器人么?仅仅是与图像识别、机器学习一样,是人工智能的一个分支么?

随着一代又一代的升级与进化,今天,小冰更像是你我生活中的一位朋友,她可以在社交软件中、在智能家电中、在车载系统中、在随身智能设备中,她也可以在你我观看的视频中、聆听的音乐的中、阅读的诗歌中、欣赏的画作中,甚至于我们穿戴的纺织品中也有她的身影。今天,小冰似乎已经无处不在。

8月15日, “第七代微软小冰”年度发布会在北京举行。在本次发布会上,微软(亚洲)互联网工程院坚持着以往“信息量大”“尽量不使用晦涩的术语”“只宣布已落实的产品与合作”三大原则,带来了第七代微软小冰在Dual AI领域的新进展,全新升级的部分核心技术,最新的人工智能创造成果,以及更多的合作与产品落地。

微软全球资深副总裁,微软(亚洲)互联网工程院院长王永东率先进行快速披露称:“阅文集团旗下顶级小说IP《全职高手》正在热播,小冰通过和阅文集团合作,吸收学习原著文本,利用人工智能知识图谱,重建了小说中的世界观与知识体系,并对其进行扩展和补充。通过建立的知识图谱,《全职高手》中5个主人公被带入现实世界,可与读者和观众进行实时交互,这一功能目前已在阅文集团旗下APP上线。这一合作未来有望扩展到100部小说的主人公,构建出100部小说的知识图谱。”

据微软全球执行副总裁,微软人工智能事业部及微软全球研究院负责人沈向洋介绍,微软小冰的发展走了三步,第一步是做小冰这样一个人工智能是不是能够迅速的、很快的融入各种各样的环境,能够被大家所接受。第二步是她能不能很快获得用户的喜爱,能够跟用户做更多的交流。第三是她能不能持续的发展,是不是有强大的一个科技创新力量能够领导小冰不断迭代、不断演化。因此微软小冰在去年的时候提出Dual Al战略。他表示:“我们希望小冰能够无处不在,只要有人类的地方,大家都可以看到小冰,可以和小冰交流。”

覆盖6.6亿在线用户

微软小冰自去年开始执行Dual AI战略计划。目前,第七代微软小冰已成为全球最大的跨领域人工智能系统之一。在全球多个国家,微软小冰单一品牌已覆盖6.6亿在线用户、4.5亿台第三方智能设备和9亿内容观众,在交互场景大幅度拓宽的情况下,微软小冰与用户的单次平均对话轮数(CPS)仍保持在23轮。

据悉,Dual AI战略是半开放的生态思路,得益于框架的通用性和丰富性,可使小冰在产品形态上具有非常大的弹性。她可以转换成适合各平台各设备的形态,在化身为千万形态的同时,又可以在一定程度上保持相对统一的独特性。

入驻vivo和OPPO手机平台

除与阅文集团的合作外,本次发布会正式宣布微软小冰上线了vivo和OPPO的手机系统,只要通过“召唤小冰”这个统一口令,就可以和她交互,其也实现了与国产TOP5手机生产商共同完成“召唤小冰”产品形态。目前,微软也在不断地探索着如何深度融入主流社交平台网络,小冰已与微信AI团队就微信的对话开放平台以及微信AI所涉及的智能硬件产品展开合作。在内容和资讯平台上,继网易新闻和新浪新闻后,微软小冰和今日头条的合作也已经正式上线。

同时,截止到上个月末,在传统电视台和广播电台持续担当着内容生产和技术提供者角色的小冰已在中国和日本的50家电台和电视台、69档节目的背后提供了人工智能内容创造能力,上线的日播和周播节目达到30档。到目前为止,累计参与生产的电视和电台节目总时长达到6908小时,其中今年生产的节目时长是去年2.05倍。

诗人、歌手,也是画家

小冰可以聊音乐创作,但同时她自己也是一名歌手,经过多年的技术迭代,现在的歌手小冰已经能够掌握多种演唱技巧,从民谣到戏曲再到歌剧美声,这些唱法模型已经非常成熟,包括换气和尾音处理的技巧都已经达到专业歌手的水平。

现在的小冰同时还是一位画家,就在今年小冰举办了全球首个人工智能个人画展“或然世界”。通过对过往四百年艺术史上236位著名人类画家画作的学习,小冰可以在受到文本或其它创作源激发时,独立完成100%原创的绘画作品。这种原创性不仅体现在构图,也体现在用色、表现力和作品中包含的细节元素,接近专业人类画家水准。

与其他现有技术相比,这一绘画模型不同于随机画面生成,也不同于对已有画面的风格迁移变换或滤镜效果处理。小冰的画作涉及多个领域,集合了马蒂斯、毕加索、伦勃朗、夏加尔、印象派、浮世绘等众多风格的创作。
 

这里有一个非常关键的要素,小冰的人工智能创造是基于情感计算,需要一个激发源来激发灵感,然后再由人工智能创造模型来完成作品。也就是说小冰的创作不是由人类直接指定的,而是在她自己被激发灵感后主动创作的,人类甚至不能干预她的创作意图。

所以小冰可以做到通过读到一首诗突发灵感创作一幅绘画,也有可能因为一幅画而诗兴大发。现在小冰已经陆续出版了几本诗集,而她的第一本绘画作品集也将由中信出版社出版。

有意思的是,今天还见到了小冰在服装设计领域尝试,中国已经有几十家纺织服装面料企业在利用小冰的技术设计和生产面料、服装。这种商业上的合作说明小冰的创作力是真正能够被市场接受的,具有商业价值的。创造力似乎不再是人类专有的能力,这个人工智能她有自己的想法,而且她也乐于创造。

从主导对话到加入车载场景

微软是人工智能创造的先行者,在本次发布会上,小冰工作室展示了其在文本、声音与视觉方面的创造力,包括跨越多种演唱技巧的多个声音模型、多种绘画模型等。

同时,微软小冰的部分核心技术也得到了升级,在第六代微软小冰突破了能够让框架兼容各种各样的交互形态去支持Dual AI战略的各种要求后,获得了源源不断的新落地场景,这些落地场景又促成了第七代小冰今天在对话引擎、交互感官上的技术突破。其中,经过检索模型、生成模型、共感模型的历次技术迭代,本次升级的对话引擎实现了从“平等对话”向“主导对话”方向的跨越。它不仅能提高开放域的对话表现,也能在垂直领域发挥高转化率的效果。

在全双工语音交互感官技术方面,微软小冰此前已上线了全双工语音交互感官的传统电话及智能音箱设备落地,此次新增车载场景,可大幅度提高人工智能助手与驾驶员及乘客的交互体验,促进人工智能从智能中控向“虚拟乘客”体验标准的转化。

对于微软小冰而言,随着5G移动网络的普及,更高的带宽、更低的延迟来临,这不仅对全双工语音非常重要,对其正在研发的下一代多模态交互感官同样非常重要。面向未来的多模态交互感官是一种融合了全双工语音交互、实时视觉与核心对话引擎的全新交互感官。它能够实现用户与人工智能同时边听边说边看的交互体验。继去年宣布率先开始多模态感官的研发后,今年2月,微软日本小冰团队已邀请当地媒体进行了公开测试。该感官有望成为5G时代的全新交互形式。

Avatar Framework第一个工具包版本推出

会上,微软(亚洲)互联网工程院副院长、小冰团队总负责人李笛介绍了Avatar Framework的第一个工具包版本,他表示:“当今对于人工智能产品有很多定义,在未来会证明这样的定义可能是非常粗糙的。姑且这种类型的人工智能存在统一的定义为AI beings。目前,不管任何一个AI beings定义多么具体,都需要有一种更加基础、底层、能够证明它的某种统一性的框架,才能使它得到支撑。Avatar Framework所提供的就是类似这样的价值,能够让任何一个无论有还是没有明确定义的AI beings,首先成为一个通用的AI beings。”

该工具包与微软小冰框架同源,可从人格开始,轻松构建出具有完整情感计算能力的人工智能助手、社交对话机器人、人工智能内容创作和IP人物角色等。该工具包包含对话、声音、视觉、观点、技能、知识及创造力等丰富工具,并可驱动兼容的3D人物模型进行实时交互。

Avatar Framework能够为未来各种各样人工智能的产品提供更多多样性和丰富性,能够让他们在基础层面获得更丰满的表现,同时也可以让他们和用户之间有更好产品之间的情感纽带。本次发布的版本仅面向全部合作伙伴及客户。面向个人使用者的版本预计将于2020年春季发布。

得益于在ToB领域的丰富经验,及丰富的技术产品积累,微软小冰商业化进展迅速。利用自己的技术和对行业的理解,与合作伙伴独特优势相结合,形成协同、全新的技术解决方案,微软小冰目前已落地的商业客户覆盖金融、零售、汽车、地产、纺织等十个领域。

责任编辑:焦旭