更新时间:2016-10-22 09:08点击:
搜狗CEO王小川
新浪财经讯 “奇点·创新者峰会2016”于7月15日-16日在上海举行。搜狗CEO王小川出席并演讲。
王小川在谈到人工智能时表示,对于搜索公司而言,人工智能技术的引入没有颠覆市场,而是使用户需求得到渐进性的提升。“搜索公司本身就在做人工智能”,其称。对于搜索引擎的下一步发展,王小川认为,语音搜索会是一大亮点,在现场,王小川还展示的搜狗的语音识别搜索技术。
以下为演讲摘编:
王小川:谈到人工智能,我会有一些反思,大家可能过多的高估了人工智能的未来。上半年,我还是鼓吹AlphaGoo这样一场跨世纪比赛的人。当下,全球范围内的投资异常活跃,中国也一样。在这个时候,我想谈到“我们得小心,什么地方是陷阱,什么地方是真的人工智能的未来”。
一个月前,我去谷歌跟AlphaGoo的工程师做了深度沟通。有什么样的算法能够改进赢得第四局的比赛?谷歌的工程师跟我苦笑说:你讲的方法我们都试过了。回到我们对于深度学习的讨论,今天大家知道它有巨大的危险。因为传统做人工智能的一些专家就在语言深度学习本身有它的缺点,稳定性不够。在一些需要完全可靠的场景里面,它没有完整的数学计算和证明。所以这种情况里面,即便它是99%的正确性,也可能会带来不确定。比如:在无人驾驶领域,这1%都不确定性,就可能带来汽车的失速,而且我们还不知道怎么修改。深度学习能够做很多事情,但是到现在我们人类的技术掌握还是太浅的。
今天语音识别已经到了比较高的准确度,已经接近实用了。但是还有很多的限制。比如我们需要安静的环境。当有噪音的时候,如果同时有两个人在说话,机器就搞不定了。我没有办法去去除噪音,比如在汽车里。我们会预先录制有发动机引擎的声音,或者是车窗玻璃的噪音把它加到我们的识别系统里去。就把机器没见过的环境,变成机器见过的环境就能够做识别了。但我跟工程师聊,如果有两个人说话怎么办呢?总有一个人的声音是听不见的。我们的解决方案是用麦克风矩阵,当有一种麦克风的时候能够定向的做识别,如果两个人不同的位置不同的声音音源,就可以分离开。
人是靠两只耳朵定声音吗?如果只有一只耳朵,或者两个人在同一个方向说话,会怎么样?人是能识别的。对吧?机器就做不到了。我也问了搞神经科学的人。他们会说,如果当有两个人说话的时候,位置不一样,人就能分离开。如果位置一样,一个人声音大,一个人声音小,也能分开,如果两个人声音一样大,一个是男声、一个是女声,也能分开。如果都是男声,但一个人说中文,一个人说英文,也能分开。所以人是在一个环境当中,只要能够找到一线机会去把两个声音的不同能够找到这样一个特征,就能动态的去分离。
但是对不起,今天在全球范围内,我们号称在语音识别有各种各样的重大突破,还是解决不了这样的问题。所以我们知道,今天的计算机离人还有巨大的距离。除了这样的一个技术本身的瓶颈以外,我们在创业当中,有很多领先的技术公司还会面临什么样的瓶颈?很危险的,一种可能性就是有技术。带着这种技术去找市场,比如:我们做了人脸识别,就开始想像人脸识别怎么去使用,就去找市场的方向。但是很有可能在这个过程当中没有找到,我们公司就死掉了。也有一种可能性是在找市场的过程当中,我们花了很多力气去组建销售团队。我们去尝试跟各个领域去结合,但是这个时候,忘了技术的源头。因为技术是不断在迭代更新的,如果我们不能够跟高效、跟前沿的技术保持同步,可能我们偶尔找到了一点市场,但是我们的技术一定变落后。
今天在中国的人工智能领域里面,做语音识别、图象处理的公司有很多已经掉到了这个陷井里。所以我跟投资人也在讲,非常不容易,技术本身就没有这么靠谱。即便技术靠谱,可能没有市场,即便有了市场,可能我的技术已经丢掉。像我们的做法,就是已经有广大的市场,搜狗的输入法、搜狗的搜索已经有千万的用户在使用。这种情况我们去找技术的时候,就会心里更加的踏实。
我在这里画了一个简单的树,树根就是技术、树干是我们的产品。大家真正开花结果是最后的市场。所以有些情况,当我们有根的时候要努力的发芽、长树干,要等它们开花结果,中间的困难是非常多的。而还有很大的困难,如果有了这样一些果实,我们有了市场的时候,或者我们认为我们有市场的时候把根基给丢了。人工智能跟高校、学术界的联动是比较多的,要不断的跟技术的前沿保持同步。比如李志飞一定会要求他的工程师团队读论文甚至写自己的论文,把这个前沿给跟上。人工智能创业不像以前的互联网创业一样有一个模式就够了,而是要不断的把技术积攒起来。
在这里面也提到一个命题作文:我们怎么讨论“技术”跟“幸福”之间的关系?在座大多数的人本身不是搞技术的,因为大家敬仰技术、崇拜技术,所以我们会过度的沉寂在技术里,自己想像出它无限的光环。其实跟幸福没关系,是因为我们的不理解、恐惧和向往带来了一种误解。
现在有一些比较酷的场景实现了,比如自动驾驶、能听懂我说话、诊断疾病、一键送咖啡。这些听了是不是有一些幸福感?不再是“虚拟现实”这样冷冰冰的术语,这是我们看到的幸福。
搜狗对于技术和幸福之间的联系和理解是什么样的呢?其实有朋友跟我谈搜索的时候说,王小川,你们要转型做人工智能了吗?我说:不是,搜索本身就是一种人工智能,而且是有幸福感的人工智能。因为它能让每个人变的更加强大,有时候我跟一个90后走在一块。我发现他很厉害,他无所畏惧。因为他知道拥有了搜索之后,能够解决所有的问题。只要一搜索就有答案。所以今天的这些年轻人,利用技术、利用搜索,变得更加的强大,拥有了更大的幸福感。为什么说搜索就是一种AI呢?
搜索的第一步是让用户去做关键词的搜索,然后给它提供10条链接。这是搜索今天产品运行的基本方式,但是关键词是最好的输入模式吗?乔布斯告诉我们,更好的方式是用手指直接在屏幕上戳。所以关键词的输入,相对于人的自然输入,就像用鼠标和用手指自然表达一样,是需要继续去提升的。因此搜索引擎往下的进展方向,就是从关键词搜索转变成让人去表达一个完整的句子,机器找出中间的含义。