三角兽联合创始人&COO 马宇驰将会做客「黑氪HitCrunch 2017」,聊聊语义识别将如何引起「Big Bang」。 文末可购票!
罗永浩在锤子科技 2016 年新品发布会上演讲了近三个小时。他除了推销了锤子科技最新生产的 Smartisan M1 以及 Smartisan M1L 外,最激动人心的部分是介绍了语音识别、Big Bang 和 One Step 三项重要功能。
其中的 Big Bang 功能,就是将那些大段的文字——不管它们是以图像还是文字的方式存在,不管它们是中文还是英文——切割成「段」,以被更加方便的复制、粘贴。
图片来自 Appso
昨天的锤子科技 2017 新品发布会上,Big Bang 功能升级到 2.0,新增了“大爆炸编辑模式”和“炸了又炸”功能。而 Big Bang 这项让人大开眼界的功能,采用的其实是一家叫做三角兽的人工智能公司的语义技术。
图片来自锤子科技官网
三角兽正在做的是提供开放域聊天系统和端对端对话解决方案。他们将数百个垂直领域归纳为几个模型,将自然语言理解,对话管理和自然语言生成等技术,生成完整的解决方案,是一家中文智能交互系统的研发商。用一个例子简单概括,计算机视觉的公司负责机器人的眼睛,而三角兽负责机器人的语言系统——不仅仅是「说」,更重要的是如何说,怎么说,说什么。
CEO 王卓然曾在英国学习十年,是 University College London 的博士。因为国外的学习经历,王卓然在智能交互领域研究深入,他先后在东芝、百度的人工智能相关部门任职,现已成为智能交互、机器学习和垂直领域对话系统方面的专家。技术合伙人亓超则是微软小冰的技术创始人。
两人相遇于百度度秘的团队。当 2016 年人工智能大热,王卓然认为语言智能交互是大有可为的领域,便拉上亓超一同创业。2016年 2 月,他们同联合创始人马宇驰一起成立了三角兽科技,目标是打造一套基于NLP、深度学习技术的中文聊天对话系统。
王卓然将语音方面的人机交互分为三个领域:闲聊、单轮问答和多轮对话。简单来讲,闲聊就是在人没有具体需求,只是想要寻求陪伴、开心的时候与机器的交谈,比如调戏微软小冰;单轮问答的技术路线更倾向于一个智能化的搜索引擎,人与机器之间是一问一答的形式;而最复杂的属于多轮驱动任务的对话。机器需要根据人说话的上下文跟踪,来判断需求,完成任务,比如订票、帮忙买咖啡等等。
左起分别为亓超、马宇驰、王卓然
目前中国市场上出现了很多「傻瓜式」机器人,王卓然说,这样的境况源于他们底层的语音识别技术没有做好。而三角兽则能够在聊天当中加入各种各样的任务,这也综合了王卓然和亓超的技术优势。
不管是初创公司还是大公司,都面临着同样的问题:没有足够多的、适合人工智能介入的场景。三角兽目前的做法是与 B 端的合作公司一同探索,验证不同的使用场景。「理想情况下是在这个过程每一步趟出一些场景是比较有广泛的2C 的市场,但这个市场足够大可以去切。」亓超说。
他们的技术目前已经被验证可应用的方向主要集中在智能家居、智能穿戴、智能车载领域。主要的合作伙伴已经有很多,已经面向用户的 Rokid 机器人;优必选,他们选择将这个智能交互的解决方案交给三角兽;想成为「国内特斯拉」的威马汽车则需要三角兽帮忙完成一个智能的汽车中控台以及锤子科技。
这些也是目前我们可以想象的,凡是需要语音交互的场景,三角兽都可以将自己的解决方案应用其中。
除此以外,三角兽目前集中探索的另一个主要领域是二次元与泛娱乐市场。他们正在将这套聊天机器人进行性格定制,帮助一些文娱公司「复活虚拟角色」。想象一下,不久的将来,我们就可以与自己喜欢的形象互动,甚至将他们「锁定」在身边。
马宇驰认为三角兽的技术在二次元领域的应用前景足够大,「我们想要那些虚拟的角色复活,让它可以跟你自由地对话。二次元用户把很多虚拟角色当成自己生命中的一部分,但这个角色其实它不能跟你交互。如果我让他给你陪伴的同时能够去聊天,不是将整个产业做了一次升级吗?」
将人工智能真正带入人们的日常生活充满挑战。但是马宇驰他们对此仍然抱有乐观预期,人工智能颠覆人们生活是早晚的事情,只是这个颠覆有一个中间过程。它要首先成为我们生活的补充,应该是从你现有的交互模式,从电脑到手机,到你将来可能习惯你身边有一个东西,你可以通过语音,或者通过一个什么方式用自然语言去交互。人工智能的第一步不是取代你的手机、电脑,而是它可能是在你不方便使用这东西的时候,有一个可以给你增补的选择。
未来已来,我们都在路上。
↓ 点击阅读全文,立即获取黑氪 2017 入场券!