diwang(王迪)

本文作者:内部搜索平台部自然语言处理中心总监,专家工程师。毕业于中科院计算所,2008年7月加入腾讯,一直从事自然语言处理和搜索技术相关工作,先后参与过搜索广告、网页搜索、问答、音乐、应用宝等垂直搜索,以及新闻个性化推荐产品的研发工作。

4月12日Facebook在旧金山召开的F8开发者大会上,公布了Messenger企业平台(Business On Messenger platform),开发者可以通过其开放的聊天机器人API,构建基于Messager平台的自己的聊天机器人,通过聊天的形式为用户提供客服、天气、订餐、资讯、购物等服务。这是继2015年推出虚拟助手应用M之后,facebook在聊天机器人领域的又一次重大动作。Facebook希望基于聊天机器人开放api,其平台上入驻的近5000w商家可以打造自己的聊天机器人,为facebook的九亿用户提供各式各样的服务。David Marcus是Facebook聊天业务的VP,他的愿景是机器人会推动后APP时代的世界,聊天是未来的网页,Messenger是未来的聊天。

说到聊天机器人,我们自然会想到苹果的Siri、微软的小冰和Cortana、google的Google Now,以及百度的小度机器人和度秘等产品。IBM的智能问答机器人Waston也可以算作聊天机器人的一种,只是Waston更偏重知识问答。随着这次facebook聊天机器人开放平台的推出,预计未来几年聊天机器人领域也将会变得更加火热。

随着移动设备和智能终端的普及,用户与机器交互的媒介也在逐渐发生变化,越来越多的用户更喜欢以语音自然语言的方式进行交互。想象一下,未来我们面对一个家务机器人的时候,你是愿意在他的屏幕上各种输入呢,还是更愿意躺在沙发上对他说几句就搞定了呢?语言是人类交互最自然的方式。因此近年来语音识别、聊天机器人领域在工业界和学术界也变的备受关注。

从提供的功能和场景上来看,聊天机器人可以分为情感聊天型、个人助理型、知识问答型、智能客服型。情感聊天机器人主要是为用户提供情感陪护、精神慰藉的功能,以生活化聊天为主,典型应用是微软小冰,小黄鸡。个人助理型机器人,通过语言交互系统实现个人事务的查询、处理,以及商业化服务的代办,比如收发邮件、设置提醒、订餐、购物等,典型的产品有Siri、Google Now、Cortana。知识问答型机器人主要功能是回答用户以自然语言形式提出的知识型(事实和非事实类)问题,帮助用户获取特定领域的专业知识,以IBM的Watson为代表(2011年Watson在智力竞赛节目Jeopardy中战胜人类冠军取得胜利)。

智能客服型机器人主要为产品客户提供关于产品服务的查询、反馈、售后等服务,减少大量的人工客服需求,以京东的JIMI机器人为典型代表。未来基于Facebook的机器人API第三方商家可以根据需要构建不同功能组合的机器人。近几年聊天机器人在工业界和学术界引起了广泛的关注,但不管是实际产品体验效果,还是学术研究的效果,都远没有达到让人非常满意的程度。很多人使用微软小冰和Siri,都是调戏和娱乐为目的。背后的最主要原因,还是自然语言理解的复杂性和困难,相较于AlphaGo机器人战胜李世石,目前机器对语言关键问题的处理还处于比较初级的阶段。比如下面这个小学一年级的语文阅读题目,相信大部分6岁的小朋友都能轻松给出答案,并且也能轻松应对类似的题目。然而这样一个题目,我们现有的聊天机器人基本上无能为力(即便是为解决该问题进行了专门的优化,变换其他类似问题也比较困难)。

事例一

转眼间,冬天又到了,刺猬要冬眠了。他刚把门关上,就听到有人敲门,原来是小鸭子看到他。小鸭子说:“刺猬大哥,为了治好你的关节炎,我把平时蜕下来的毛织在一起,给你缝了一条柔软的鸭绒被,这样,你整个冬天都能睡得暖和了。”问题:1、文章写了( )送给刺猬( );2、哪个小动物生病了,是什么病?

以这段文字为例,在技术上还存在不少关键难点亟需突破,比如:(1)语义的理解和表达。冬天-时间、刺猬-动物、他-代词是一种语义维度;毛是鸭子的一部分 也是一种语义维度;缝-谓语、柔软-定语、鸭绒被-宾语 是一种语义维度;刺猬和鸭子都是小动物、刺猬和蛇都会冬眠 也是一种语义维度;语义并没有一个严格的定义,在不同的场景使用不同的衡量维度,人可以灵活处理这些变化。机器怎么准确这些语义,并根据不同的场景需要,选择合适的维度呢?

事例二

2)聊天上下文一致性的处理,下面这个例子是一个典型的聊天机器人自动回复的结果,Q:你的孩子几岁了?A:我儿子五岁了 。Q:孩子男孩还是女孩?A:我生了个女孩,很漂亮。Q:什么时候怀孕的?A:前年。

这里涉及到上下文补充,指代消解,以及语义一致性的问题,机器如何获取、存储知识,并根据知识指导答案,目前还很难处理地很好,所以才会经常出现这样前后矛盾啼笑皆非的情况。

事例三

归纳推理和演绎能力缺失,比如“将《世上只有妈妈好》这首歌改成爸爸唱一遍”对一个三岁的孩子来说几乎没有什么难度,然而对机器来说却异常困难,机器想要理解这个题目本身就是一件很有挑战的事情,更不用说利用爸爸-妈妈对等关系进行归纳类比应用了。

事例四

情感的理解和表达,可以认为是机器人的情商。通过用户文本或者语音输入,判断用户的喜怒哀乐等情绪,使用恰当的情绪进行自动回复,这也是一个很有挑战的问题。

归根到底可能还是因为我们对人脑如何存储、处理、理解、使用语言并没有完全掌握,现在还没有办法对这些问题进行完备的建模。近年来deep learning在图像和语音领域在学术界和工业界都取得了突破性的进展,越来越多国内外研究人员也开始引入deep learing来解决NLP相关的问题。

虽然聊天机器人在技术上还存在不少挑战亟需解决,但在一些限定领域的场景下,问题就会变得简单很多,可以取得让人较为满意的效果。但是真的可以通过图灵测试的聊天机器人,要像“大白”一样可以与人准确、自然、带情感地交流,未来的路还有很远。

文章来源于腾讯云开发者社区,点击查看原文