更新时间:2017-05-24 06:15点击:
雷锋网按:5月20日,由中国计算机学会(CCF)主办,Xtecher协办的2017 CCF青年精英大会在北京国家会议中心举行。中国工程院院士赵沁平、香港中文大学教授汤晓鸥、百度创始七剑客之一雷鸣等围绕“科研·产业·融合”这个主题做了一些分享。其中,汤晓鸥教授做了题为《人工智能的明天,中国去哪?》主题演讲。
在汤晓鸥教授看来,不管中国人工智能接下来如何发展,不管年轻人如何创业或者做研究,我们要做的只有三件事:坚持、创新、以及落地。
在谈到“在中国创业是怎样一种感受”时,汤教授称,“创业的困难是一定存在的,年轻人要不要创业?尽管路上的坑比较多,但还是可以试一试。”显然,汤教授对年轻人创业持鼓励态度,至于用谁的资金创业,汤教授表示,不要用父母的钱,要用投资人的钱。因为,“劫富济贫,人人有责。”
汤晓鸥:香港中文大学信息工程系主任。博士毕业于麻省理工学院,曾任微软亚洲研究院视觉计算组负责人,2009年当选IEEE Fellow,ICCV09程序委员会主席,ICC19大会主席。2009年获计算机视觉顶级会议CVPR最佳论文奖。2014年其团队研发的人脸识别算法全球首次超过人眼识别能力。
雷锋网对演讲全文做了不改变原意的整理:
今天我演讲的题目是《人工智能的明天,中国去哪儿?》,我选了一个比较大的题目,希望能压住场。原来我想的题目比这个还大——《人工智能的明天,地球去哪儿?》,后来发现“一带一路”会议刚刚开完,“地球去哪儿”的问题已经解决了,我还是回到我的小题目——“中国去哪儿”。
不管中国人工智能接下来如何发展,不管年轻人如何创业或者做研究,我们要做的事情也就这三件:
第一,要坚持,要花时间把基础打好;
第二,要做创新。要做新的东西,不要老是跟在别人后面走;
第三,要把飘在上面的东西落地,要产业化。
今天,我从我们实验室的研究成果和公司做的产品,来讲讲我对这三个方面的理解。
什么是深度学习?首先,什么是人工智能?这个概念现在已经非常难定义了,大家几乎把所有的事情都往人工智能上靠。从我的理解来讲,人工智能真正落地的部分就是深度学习。因为以前的人工智能确实是在很多情况下用不起来,人手设计的智能来做某一件事情还是比较难超越人。而有了深度学习之后,我们可以把这个过程变成一个数据驱动的过程:当做某一件特定事情时,数据量及参数量大到一定程度之后,机器就可能在做这件事情上超过人类。很多现实中落地的产品化的东西,都是深度学习做出来的。深度学习做的东西,成功的案例比较多,一方面是在语音识别领域,另外可能更多的是视觉这方面,所以大家可以看到很多计算机视觉方面新的成果。我今天给在座讲的人工智能其实也就是计算机视觉,用深度学习去做计算机视觉,就变得更窄了。
大家可以看到“深度学习(Deep Learning)”这个词在谷歌上的搜索情况:从2006年才开始有人搜索这个词,是Hinton和Yann LeCun们那个时候发明了这个算法。这中间很长一段时间,2006-2011年曲线是很平稳的,只有学术界才会去搜索这个词语,才知道这个事情。2011年突然之间搜索量开始呈现指数型增长,各行各业都在讨论深度学习,现在搜索量已经非常的巨大。这条曲线形象地演示了深度学习的爆发过程。
深度学习到底在做什么事情?实际上它所做的事情抽象出来是比较简单的,就是在做一个从X到Y的回归、或者说从A到B的Mapping(对应)——你给它一个输入,它怎么样给出一个对应的输出?特殊的地方就是深度学习把这件事情做得非常非常好。以前也有其他算法可以做,只不过一直做不过人,现在深度学习做到了极致。
比如说给了一张人脸照片,它就可以给你对应出这个人的名字;给一个物体的形状,它就可以告诉你是什么物体;给一个车的行驶场景,它就可以给你输出这个车应该往哪儿拐;给一个棋局,它能算出下一步怎么走;给一个医疗的图像,它就能帮你判断这是什么病……实际上就是这样的一个过程。不要把人工智能想象成可以超越人类,可以控制人类,这些都是所谓的“好莱坞的人工智能”或者想象中的人工智能,真正人工智能在现在这个阶段其实就是做这么简单的事,当然,做成这个简单的事情其实已经很不简单了。
深度学习的突破最近这几年深度学习确实在学术界、工业界取得了重大的突破。第一个突破是在语音识别上。Hinton和微软的邓力老师,在2011年用深度学习在语音识别上取得了巨大的成功。昨天可能大家的微信也被刷屏了,我们中国科大毕业的师兄邓力老师从微软出来到顶级对冲基金工作。我的理解这也是一个A to B的mapping 的过程:把邓老师的深度学习的经验等内容都输入到对冲基金的算法里,这个对冲基金的钱就自动Map到了邓老师口袋里。
语音识别取得了巨大成功以后,深度学习紧接着在视觉方面又取得了重大突破。2012年时,Hinton在ImageNet上将图像识别一下子提高了十几个点,以前我们都一年一个点在推,他一年就推了十年的进步,在学术界引起了很大的轰动。2014年我们团队做人脸识别,通过深度学习,做到算法首次超过人眼的成绩。
最后,在2016年,还是谷歌最厉害,每年120亿美金的研发投入没有白投,下了一盘棋叫AlphaGo,这盘棋下完之后人工智能就不需要我们解释了,大家忽然都明白了,人工智能原来是这么回事儿,就是下棋。
接着人工智能在自动驾驶领域也取得了一些重大的突破。现在比较热门的是医疗影像方面,借助人工智能进行诊断。
深度学习的三要素
深度学习有三个核心的要素:
学习算法的设计,你设计的大脑到底够不够聪明;
要有高性能的计算能力,训练一个大的网络;
必须要有大数据。
接下来分享我们在深度学习方面做的一些工作。我们从2011年开始做这项工作,一开始没有开源的框架,所以自己要做很多的工作。做的时间长了,我们就做了一套Parrots系统,这个系统目前还不是开源的。