汤晓鸥：深度学习有哪三个要素，以及在中国创业是怎样一种感受？

更新时间：2017-05-24 06:15点击：

雷锋网按：5月20日，由中国计算机学会（CCF）主办，Xtecher协办的2017 CCF青年精英大会在北京国家会议中心举行。中国工程院院士赵沁平、香港中文大学教授汤晓鸥、百度创始七剑客之一雷鸣等围绕“科研·产业·融合”这个主题做了一些分享。其中，汤晓鸥教授做了题为《人工智能的明天，中国去哪？》主题演讲。

在汤晓鸥教授看来，不管中国人工智能接下来如何发展，不管年轻人如何创业或者做研究，我们要做的只有三件事：坚持、创新、以及落地。

在谈到“在中国创业是怎样一种感受”时，汤教授称，“创业的困难是一定存在的，年轻人要不要创业？尽管路上的坑比较多，但还是可以试一试。”显然，汤教授对年轻人创业持鼓励态度，至于用谁的资金创业，汤教授表示，不要用父母的钱，要用投资人的钱。因为，“劫富济贫，人人有责。”

汤晓鸥：香港中文大学信息工程系主任。博士毕业于麻省理工学院，曾任微软亚洲研究院视觉计算组负责人，2009年当选IEEE Fellow，ICCV09程序委员会主席，ICC19大会主席。2009年获计算机视觉顶级会议CVPR最佳论文奖。2014年其团队研发的人脸识别算法全球首次超过人眼识别能力。

雷锋网对演讲全文做了不改变原意的整理：

今天我演讲的题目是《人工智能的明天，中国去哪儿？》，我选了一个比较大的题目，希望能压住场。原来我想的题目比这个还大——《人工智能的明天，地球去哪儿？》，后来发现“一带一路”会议刚刚开完，“地球去哪儿”的问题已经解决了，我还是回到我的小题目——“中国去哪儿”。

不管中国人工智能接下来如何发展，不管年轻人如何创业或者做研究，我们要做的事情也就这三件：

第一，要坚持，要花时间把基础打好；

第二，要做创新。要做新的东西，不要老是跟在别人后面走；

第三，要把飘在上面的东西落地，要产业化。

今天，我从我们实验室的研究成果和公司做的产品，来讲讲我对这三个方面的理解。

什么是深度学习？

首先，什么是人工智能？这个概念现在已经非常难定义了，大家几乎把所有的事情都往人工智能上靠。从我的理解来讲，人工智能真正落地的部分就是深度学习。因为以前的人工智能确实是在很多情况下用不起来，人手设计的智能来做某一件事情还是比较难超越人。而有了深度学习之后，我们可以把这个过程变成一个数据驱动的过程：当做某一件特定事情时，数据量及参数量大到一定程度之后，机器就可能在做这件事情上超过人类。很多现实中落地的产品化的东西，都是深度学习做出来的。深度学习做的东西，成功的案例比较多，一方面是在语音识别领域，另外可能更多的是视觉这方面，所以大家可以看到很多计算机视觉方面新的成果。我今天给在座讲的人工智能其实也就是计算机视觉，用深度学习去做计算机视觉，就变得更窄了。

汤晓鸥：深度学习有哪三个要素，以及在中国创业是怎样一种感受？

大家可以看到“深度学习（Deep Learning）”这个词在谷歌上的搜索情况：从2006年才开始有人搜索这个词，是Hinton和Yann LeCun们那个时候发明了这个算法。这中间很长一段时间，2006-2011年曲线是很平稳的，只有学术界才会去搜索这个词语，才知道这个事情。2011年突然之间搜索量开始呈现指数型增长，各行各业都在讨论深度学习，现在搜索量已经非常的巨大。这条曲线形象地演示了深度学习的爆发过程。

汤晓鸥：深度学习有哪三个要素，以及在中国创业是怎样一种感受？

深度学习到底在做什么事情？实际上它所做的事情抽象出来是比较简单的，就是在做一个从X到Y的回归、或者说从A到B的Mapping（对应）——你给它一个输入，它怎么样给出一个对应的输出？特殊的地方就是深度学习把这件事情做得非常非常好。以前也有其他算法可以做，只不过一直做不过人，现在深度学习做到了极致。

比如说给了一张人脸照片，它就可以给你对应出这个人的名字；给一个物体的形状，它就可以告诉你是什么物体；给一个车的行驶场景，它就可以给你输出这个车应该往哪儿拐；给一个棋局，它能算出下一步怎么走；给一个医疗的图像，它就能帮你判断这是什么病……实际上就是这样的一个过程。不要把人工智能想象成可以超越人类，可以控制人类，这些都是所谓的“好莱坞的人工智能”或者想象中的人工智能，真正人工智能在现在这个阶段其实就是做这么简单的事，当然，做成这个简单的事情其实已经很不简单了。

深度学习的突破

汤晓鸥：深度学习有哪三个要素，以及在中国创业是怎样一种感受？

最近这几年深度学习确实在学术界、工业界取得了重大的突破。第一个突破是在语音识别上。Hinton和微软的邓力老师，在2011年用深度学习在语音识别上取得了巨大的成功。昨天可能大家的微信也被刷屏了，我们中国科大毕业的师兄邓力老师从微软出来到顶级对冲基金工作。我的理解这也是一个A to B的mapping 的过程：把邓老师的深度学习的经验等内容都输入到对冲基金的算法里，这个对冲基金的钱就自动Map到了邓老师口袋里。

语音识别取得了巨大成功以后，深度学习紧接着在视觉方面又取得了重大突破。2012年时，Hinton在ImageNet上将图像识别一下子提高了十几个点，以前我们都一年一个点在推，他一年就推了十年的进步，在学术界引起了很大的轰动。2014年我们团队做人脸识别，通过深度学习，做到算法首次超过人眼的成绩。

最后，在2016年，还是谷歌最厉害，每年120亿美金的研发投入没有白投，下了一盘棋叫AlphaGo，这盘棋下完之后人工智能就不需要我们解释了，大家忽然都明白了，人工智能原来是这么回事儿，就是下棋。

接着人工智能在自动驾驶领域也取得了一些重大的突破。现在比较热门的是医疗影像方面，借助人工智能进行诊断。

深度学习的三要素

汤晓鸥：深度学习有哪三个要素，以及在中国创业是怎样一种感受？

深度学习有三个核心的要素：

学习算法的设计，你设计的大脑到底够不够聪明；

要有高性能的计算能力，训练一个大的网络；

必须要有大数据。

接下来分享我们在深度学习方面做的一些工作。我们从2011年开始做这项工作，一开始没有开源的框架，所以自己要做很多的工作。做的时间长了，我们就做了一套Parrots系统，这个系统目前还不是开源的。

汤晓鸥：深度学习有哪三个要素，以及在中国创业是怎样一种感受？

上一篇：加盟3S，成功就在身边！下一篇：张瑞敏：你有没有“创业大赢家”的四大特征？

汤晓鸥：深度学习有哪三个要素，以及在中国创业是怎样一种感受？

相关阅读

推荐文章

热门文章