中国产经网

产经行业的
探索与发现
更多行业干货分享,关注中国产经网Www.chinaice.cN

搜狗王小川CNCC解读:为什么搜索的未来是人工智能时代的明珠?

更新时间:2016-10-28 09:10点击:

  2016年10月20日,中国计算机大会(CNCC2016)在太原召开。作为我国计算机领域规模最大、级别最高的学术会议,大会邀请了逾200位国内外计算机领域顶尖专家、企业家等参加。上午压轴出场的搜狗CEO王小川作为特邀嘉宾,发表了主题为《搜狗的人工智能之路》的演讲,他指出“搜索的未来是人工智能时代的明珠;搜索未来将走向问答机器人,而输入法也将向自动问答和智能回复发展。” 

搜狗

人工智能时代,搜索向问答机器人发展 

搜狗

  王小川认为,人工智能划分为识别、生成和决策三大领域:“在学术领域中,识别与生成是同等重要的;而要让人工智能产生市场价值,决策才是让人工智能变成商业智能的核心。”在他看来,让机器参与帮助人做决策提高效率,由此产生的商业价值才是最大的。

  而搜索作为一种人工智能,其未来又在哪里呢?王小川说,“目前我们已经很好地解决了机器识别中语音和图像的问题,但是在自然语言的处理中,我们目前还进展缓慢。今天机器仍不具有跟人交流的能力,因为它没有概念。但是在未来,搜索将走向问答机器人。”

  他举例说:“正如触摸屏正在逐渐代替鼠标键盘成为主要的机器操作方式,更自然的交互方式不仅更方便人们使用,也能为机器提供更多信息。随着机器越来越聪明,搜索也会从简单的依靠一个关键词返回十条链接,转向直接提供问题的答案。这种情况下真正有效的方式是通过自然语言问问题,形成更自然的人机交互。”他例举了包括《星球大战》、《星际穿越》《超能陆战队》等科幻电影中问答机器人的形象。对于一问一答自然交互方式的研究,王小川表示,这不仅是搜狗的研究方向,谷歌、苹果、亚马逊等多家大公司也在做同样的事情。

  输入法的未来:自动问答和智能回复 

搜狗

  搜狗输入法诞生于十年前,大数据、云输入曾为之带来快速发展,如今人工智能又为搜狗输入法带来了怎样的变化?王小川以搜狗输入法的语音识别技术举例,“用户可以直接使用语音输入或者修改,这种更加自然的交互方式也推动语音技术高速发展。”据了解,目前搜狗输入法日均语音请求接近1.8亿次,用户每天产生的语料规模超过13万小时,远超国内任何语音公司使用的语料规模。

  “最终,输入法的未来将会走向自动问答和智能回复。”王小川表示,输入法未来不再局限于简单工具,借助于人工智能技术的发展与海量数据积累,除了可以与用户做更加自然的交互,甚至还能帮助用户做决策。他现场演示了搜狗输入法的自动问答和智能回复功能:当用户想要约朋友吃饭时,直接在输入框输入餐厅名称,输入法就能自主找到餐厅的相关信息,并能够快速分享到对话中;如“你回公司了吗”“文件什么时候发我”此类问题,输入法甚至能够直接提供备选答案,用户直接点选就能快速回复,极大地提升了用户表达和获取信息的效率。

  最后王小川总结道:“搜狗做的工作本身是让表达和获取信息更简单,未来时代里,为了让人机交互和自动问答做得更好,我认为有两个核心:一是自然交互,让人与机器可以进行完整的对话。二是知识计算,为了实现自然交互,背后核心的是要在自然语言里对知识能够建模,对知识能够计算。”据悉,今年搜狗捐赠1.8亿给清华,联合成立天工研究院,将通过公开更多的数据,与高校间进行联合研究,使搜狗搜索、搜狗输入法在人机交互方面做出更大突破。

  以下为演讲全文:

  今年大家提人工智能,搜狗公司也在做人工智能。有些媒体朋友说,“你们是要转型做人工智能吗?”我听完觉得需要做一点解释。因为作为一个做搜索的公司,本身对于技术的使用是蛮多的,不管是从大数据、云计算还是到今天的深度学习,武装到牙齿的使用,本身我们的技术走多远我们的业务就能走多远。不同人对人工智能有不同的定义方法,我更多希望在技术之外从产品的角度理解人工智能有什么样的价值,我把人工智能分为三个应用领域,这和广泛的分类方法不一样:一是识别,二是生成,三是决策。

  这样一个分法描述了今天主流发展中的突破点。比如从2012年ImageNet的发展上看,图片的识别开始有了很大的提升。从这两天微软重磅的讲语音识别已经真正超过了人,这是一个识别领域的进展。因此在学术领域,我觉得做决策、做识别和做生成都是同等重要的,我想给大家一个判断,在这三个领域里,如果作为一个企业,把它变成市场价值,识别和生成本身很难背后有一个强的商业模式,而只有做决策才能变成商业智能里一个核心的过程,这是我想给大家分享的。

  投资界有的时候说,谁做的图片识别特别好,做个语音识别特别好,就畅想在未来有什么样的价值,这是很危险的事情。所以我们看到很多做图像和做语音识别的公司拿了很好的技术或成果推向市场后,并没有找到很好的应用场景,或者做一个安防,并不能创造一些直接的价值,就把它给卖掉了,或者做一些简单的to B的 License fee,所以,这里面最重要的一点,是机器能够帮助我们做决策,这个事情是三个里面的商业价值是最大的。