第4章 深度学习

今天是第三章,接下来跟大家讲两个故事。其实我不太想写得太深入,尤其是算法这块。但我想到了一本书啊这本书叫《深度学习》,所以今天我结合他跟你一起聊聊。对人工智能有所了解的大部分人都应该看过这本书,并且觉得《深度学习》一定要给自己家孩子看。但是深度学习讲的是算法,你完全没必要揪着自己家孩子去看这本书,因为在未来,人工智能的核心是数据和算力。

这本书呢,它的作者是全球10大人工智能的科学家之一,叫特伦斯切诺夫斯基。他非常厉害,因为他发明了一个词,这个词就是深度学习,如果没有他,就没有人工智能的今天。我们所有学人工智能的都知道,他是神经网络的先驱,也是他把深度学习从边缘课题,变成了互联网科技公司,再到今天依赖的核心技术,也是他实现了人工智能井喷式的发展。所以今天我通过《深度学习》这本书跟大家聊聊,算法到底是什么东西。还是一句话总结一下,深度学习是一种模仿人脑工作方式的计算机技术。他模仿人脑的目的就是处理大量的数据和复杂的任务,也就是我们说的算法。大家都知道,人的脑子里有很多神经元进行链接,机器也是一样。我们管它叫做神经网络,就是机器有很多节点,这个节点就像是我们人脑的神经元,很多节点互相连接组成计算机模型,这就是我们的神经网络了。比方说,我们现在非常著名的卷积神经网络CNN,它主要用于图像识别,像自动驾驶机车,它用的就是CNN,它来识别路标、人、红绿灯等等。不过现在还有一款神经网络叫做循环神经网络,或者叫表述循环神经网络,它叫RNN,它擅长的是处理数据。比方说,理解和生成文本,像智能助手Siri,像ChatGPT它用的就是RNN来理解和回忆你的语音命令。

深度学习其实现在已经在各个领域有了广泛的应用,比方说,谷歌的翻译就是使用深度学习实现了多语言的翻译,再比方说我们之前聊到的医疗领域,深度学习可以帮助医生分析图像,分析数据,从而帮助医生和病人更早发现癌症。像我们现在用这么厉害的人工智能,它底层逻辑全部都是深度学习,如果其实你能完整地看完这章,你就应该会知道人脑的深度学习是怎么运算出来的。不过也正是因为计算机是模拟人脑的运转方式,所以才发展成人工智能。其实你如果了解了计算机怎么深度学习的,你就会知道,那些老是背单词背不下来的同学,几乎全是深度学习很差。大家一定要记住,像人一样,深度学习就是人工智能算法的灵魂。切诺夫斯基,他对人工智能,尤其是深度学习这个领域研究了40年,他就是深度学习算法的奠基者,也是人工智能的先驱。而到现在我们都觉得他就是先驱,或者说他是最伟大的,甚至可以说没有之一,如果没有他,人工智能就无法快速发展。深度学习发展到今天,也不到60年的时间,它经历了三次非常严重的危机,又三次井喷式的发展,几乎每一次都把人工智能拖向死胡同,但是又因为有一些优秀的大脑,把他集体打捞了出来。

1965年,有四位美国科学家,他们共同发起了一个叫达特茅斯夏季人工智能研究计划,这个计划当时在人工智能圈非是常的火爆,现在很多人追溯人工智能的历史,就一定会追溯到这四位科学家,是他们开启了人工智能领域的研究。人们刚刚研究人工智能的时候,因为那个时候都是摸着石头过河,所以人工智能就分成多个方向。一个方向叫设计派,设计派的人认为,人工智能是自上而下设计出来的,就像上帝把人设计下来,只要给他明确的符号规则和方法,然后编程放进计算机,计算机就能拥有理性的思考能力。但这一切都需要设计,就像很多宗教人士认为,是上帝一点一点地将人给设计出来。但另外一方向就发现现实可能走不通,所以另外一派也叫学习派,学习派就认为,这世界上很多东西是无法设计的,像那最近特别火的Open AI的联合创始人,他就是学习派的跟随者。既然大部分伟大的事无法计划,无法被设计,那么你可以通过不停的给他喂养,大量的文本,大量的数据,让他可以不断的学习,慢慢拥有智能。

比方说有个苹果,如果是个设计派,你就要教他,这是苹果,那不是苹果,就是要不停的设计;但是学习派不这样,学习派是让计算机去看大量的苹果,相当于教计算机自己来认,然后计算机看了那么多苹果之后就学习到了,这是苹果,那不是苹果。因为计算机找到规律了,自然而然就知道了苹果长什么样。虽然我们不知道计算机具体是怎么想的,但是我们现在几乎可以明确设计派是走不通的,设计派就像我们的应试教育,不停的告诉你,这是苹果,不懂就背下来哈。那什么是学习派的素质教育,就是让孩子理解大量的苹果,见过大量的苹果之后,他意识到苹果原来长这个样。各位,这像不像人大脑,所以学习派的核心理念就是计算机通过学习和模仿人类的大脑原理,通过大量的学习案例来让你理解事物,拥有人类的智能。但是人工智能早期时代,人们没有那么多数据,自然也就无法超越设计派。早期研究人工智能的大多数先驱,都认为机器是不可能自己通过模仿就拥有智能的,机器哪能像人脑子那么牛,所以一致认为机器的智能一定是人设计它这样做的,你看这是人类的骄傲所决定的,这带来了人工智能第一次危机。如果到现在你还不理解人工智能,那么我接下来争取再次通过这个积木问题把它讲明白。那个积木问题就是如何教会机器人,像小朋友一样堆积木,积木问题的目标,就是编写一个能够理解命令的程序。比如找一个大块的黄色积木,把这个黄色积木放在红色积木上边,然后把这个程序变成机器手完成动作。大家都知道这个事很简单对吧,小朋友都会啊,你让小朋友说来,把那黄色积木堆那个红色积木上面,就非常简单,对吧?但我告诉你,这个在编程里非常难。首先就光识别出黄色跟红色,就已经很困难了,更别说去搭积木了,因为你要教他什么是黄色,你怎么定义黄色。科学家编了一个庞大的程序,结果漏洞百出,所以他们看着程序崩溃,自己也开始崩溃,说这玩意咋教都教不会。你看这像不像一个家长教孩子教不会,积木问题看似简单,其实是一个在编程领域极其困难的问题,所以如果积木问题都出问题了,你让他盖房子也是天方夜谭,更别说是人工智能了。跟大家说一下2016年是怎么解决的,它也是通过大数据的深度学习,通过学习派的这种逻辑,让他认识什么叫黄色,什么是红色,才慢慢解决了。所以60年前的设计派的这帮人,遇到第一个特别大的危机,就是积木问题,不过还好有那么一小撮人,他们是坚定学习派的,他们意识到人工智能只要通过模仿人类学习的过程,一定能够找到一种行得通的算法,所以到人工智能近期,计算机科学家集中活力,进入到学习派,他们开始模仿人类的学习方法。而这期间一位伟大的教授,他来自于康奈尔大学的弗兰克,这个罗森布拉特教授非常厉害,因为他第一个实现了一个突破,他发明了一种算法叫感知器。

在1957年,感知器能完成的功能,就像是我们刚才提到如何教计算机认识苹果,通过识别大量的图片,哪些是苹果,哪些不是苹果,感知器形成一套自己的标准,它就能认出苹果了。如果它能认出苹果,那么各位它是不是就能认出坦克等等,所以感知器最先被用在了军方程序、。这个成果也上了纽约时报,一个感知器能识别出坦克,什么概念,所有的科学家看完都傻了,因为更进一步,打仗的时候他就能识别出这不是坦克,这是伪装坦克,他就能确定这个要攻击了。因为他能认出坦克,他一定能认出枪,能认出敌人,所以科学家就决定研究怎么让感知器处理更复杂的问题。不过还是决定向人学习,感知系模仿的是我们的神经元,大家如果学会一点脑科学,知道神经元组成了一个庞大的网络,这个网络在我们脑子里边,它就是我们的记忆,就是我们的生命,所以科学家也就继续朝这个神经网络方向本进发。但是在1969年,这个著名的人工智能之父——马文明斯基,大家记得吗,这个马文明斯基也是在1956年的达特茅斯人工智能夏季研究计划的发起人,他在发起的那场世纪之讨论之中写了一本叫感知器的书,这本书里有段话说,单个的感知器只能解决有限的问题,要解决复杂的问题,必须把更多的感知器连在一起,组成人工神经网络,你看这好像很对,人的大脑是这样子的,很多神经网络他也是一样,把各种感知器连在一起,所以他就在书里做了接下来这个论断,没有办法找到一种可行的算法去训练这种人工神经网络,这就相当于把人工神经网络刚告诉你,这条线可以走,然后就告诉你没办法走通。到现在,谁也不知道他为什么会写这篇文章啊,这相当于第二次危机,整整一代人的人工智能研究者,都读过这个论文,这大哥就连自己都没往上考虑。

你知道吗?有时候我在读这些历史的时候,我就特别大的感触——人类为什么会进化,人类为什么会比上一代强?它的本质就是,这一代人不听上一代人的话,结果谁也没想到,就一小撮科学家,其中就包括特伦斯切诺夫斯基,非常讨厌那个马文明斯基。他就不死心的继续研究,最后在16年之后,也就是1985年,和另外一位人工智能领域,非常优秀的专家——辛顿,他当时就提出一个算法,可以让更多的感知器共同组成一个人工智能网络,这个算法也非常有名,大家可以查一下,叫做波尔兹曼契,这个算法它打破了十多年前那位司机的预言。顺便说一下,这俩哥们还认识,这俩哥们在06年的一个大会还见过一面,当时这位马文明斯基司机当时见到特伦斯切诺夫斯基,看的都不好意思,直接掉头就走,特伦斯切诺夫斯基就跑去找那位马文明斯基说,是不是你堵死了大家的路,你得向大家道歉,然后他说就道歉了。

话说回来,找到了感知器跟感知器之间的沟通方式,计算机科学家终于可以创建庞大的人工神经网络,来处理更大的更复杂的问题。当然第二次人工智能的浪潮也就来了,这波浪潮包括智能翻译,语音识别,无人驾驶。不过在95年前后,大家又失去信心,因为大家觉得这么多年人工智能发展太慢了,他们都认为算法可行,但是没法使用。大家都知道这个东西好,但你要怎么用它是个问题,所以这一次又遇到了寒冬,人工智能这个时候什么也不能干,只能等待,等待大数据继续发展,算力系统继续优化。如果大家都听过摩尔定律,你就应该知道,芯片内的晶体管的数量增加一倍,芯片的这个运算能力就会增加一倍,每两年都会这样,这种指数增长一定会突然间变得很可怕。像10年32位人工智能最新的发展,这都是因为芯片技术越来越强大了,2012年开始,芯片技术带来了强大的算力,在深度学习的算法带领下,人工智能迎来了第三次浪潮,这是我们今天经历的人工智能浪潮,这个浪潮会刮多久呢?我不知道,但是我问了身边人,都说至少10年。

总结一下,我们从1959年到1969年,人工智能兴起了12年,然后接下来低谷期17年,86年到95年,人工智能兴起了不到10年,之后低谷期17年,然后2012年人工智能又兴起了,到如今人工智能进入高潮,几乎就是周期性的浪潮,但是大家从这波浪潮中也能看出,万事万物都是一样,一个东西起来之后它一定会下去,所以大家也不要因为一时的兴起太过激动,也不要因为一时的落寞而太过悲伤。科技如此,生活也如此。就像现在人工智能这么火,你都愿意花钱上上培训班,花钱让孩子去接触人工智能,但是我告诉大家人工智能的趋势还会下去,但过不了多久他还会上来,所以今天看到这的你们,相信我,人工智能的趋势是波浪的向前推进。只要你相信这个赛道是永恒的,人工智能就一定会再次迎来他的高潮,我原来经常会感受到我们读历史,读文学他救不了人,他只能自救;但是人工智能这个赛道,真的可以救很多人,这也是为什么我老建议大家持续学习、多接触新事物。各位,这章到此就结束了,下一章我们聊聊无人驾驶,并分享一个故事。