第4章深度学习

书名：AI新时代
作者名：作家XA9o7E
本章字数：4539字
更新时间：2024-12-22 13:09:06

今天是第三章，接下来跟大家讲两个故事。其实我不太想写得太深入，尤其是算法这块。但我想到了一本书啊这本书叫《深度学习》，所以今天我结合他跟你一起聊聊。对人工智能有所了解的大部分人都应该看过这本书，并且觉得《深度学习》一定要给自己家孩子看。但是深度学习讲的是算法，你完全没必要揪着自己家孩子去看这本书，因为在未来，人工智能的核心是数据和算力。

这本书呢，它的作者是全球10大人工智能的科学家之一，叫特伦斯切诺夫斯基。他非常厉害，因为他发明了一个词，这个词就是深度学习，如果没有他，就没有人工智能的今天。我们所有学人工智能的都知道，他是神经网络的先驱，也是他把深度学习从边缘课题，变成了互联网科技公司，再到今天依赖的核心技术，也是他实现了人工智能井喷式的发展。所以今天我通过《深度学习》这本书跟大家聊聊，算法到底是什么东西。还是一句话总结一下，深度学习是一种模仿人脑工作方式的计算机技术。他模仿人脑的目的就是处理大量的数据和复杂的任务，也就是我们说的算法。大家都知道，人的脑子里有很多神经元进行链接，机器也是一样。我们管它叫做神经网络，就是机器有很多节点，这个节点就像是我们人脑的神经元，很多节点互相连接组成计算机模型，这就是我们的神经网络了。比方说，我们现在非常著名的卷积神经网络CNN，它主要用于图像识别，像自动驾驶机车，它用的就是CNN，它来识别路标、人、红绿灯等等。不过现在还有一款神经网络叫做循环神经网络，或者叫表述循环神经网络，它叫RNN，它擅长的是处理数据。比方说，理解和生成文本，像智能助手Siri，像ChatGPT它用的就是RNN来理解和回忆你的语音命令。

深度学习其实现在已经在各个领域有了广泛的应用，比方说，谷歌的翻译就是使用深度学习实现了多语言的翻译，再比方说我们之前聊到的医疗领域，深度学习可以帮助医生分析图像，分析数据，从而帮助医生和病人更早发现癌症。像我们现在用这么厉害的人工智能，它底层逻辑全部都是深度学习，如果其实你能完整地看完这章，你就应该会知道人脑的深度学习是怎么运算出来的。不过也正是因为计算机是模拟人脑的运转方式，所以才发展成人工智能。其实你如果了解了计算机怎么深度学习的，你就会知道，那些老是背单词背不下来的同学，几乎全是深度学习很差。大家一定要记住，像人一样，深度学习就是人工智能算法的灵魂。切诺夫斯基，他对人工智能，尤其是深度学习这个领域研究了40年，他就是深度学习算法的奠基者，也是人工智能的先驱。而到现在我们都觉得他就是先驱，或者说他是最伟大的，甚至可以说没有之一，如果没有他，人工智能就无法快速发展。深度学习发展到今天，也不到60年的时间，它经历了三次非常严重的危机，又三次井喷式的发展，几乎每一次都把人工智能拖向死胡同，但是又因为有一些优秀的大脑，把他集体打捞了出来。

1965年，有四位美国科学家，他们共同发起了一个叫达特茅斯夏季人工智能研究计划，这个计划当时在人工智能圈非是常的火爆，现在很多人追溯人工智能的历史，就一定会追溯到这四位科学家，是他们开启了人工智能领域的研究。人们刚刚研究人工智能的时候，因为那个时候都是摸着石头过河，所以人工智能就分成多个方向。一个方向叫设计派，设计派的人认为，人工智能是自上而下设计出来的，就像上帝把人设计下来，只要给他明确的符号规则和方法，然后编程放进计算机，计算机就能拥有理性的思考能力。但这一切都需要设计，就像很多宗教人士认为，是上帝一点一点地将人给设计出来。但另外一方向就发现现实可能走不通，所以另外一派也叫学习派，学习派就认为，这世界上很多东西是无法设计的，像那最近特别火的Open AI的联合创始人，他就是学习派的跟随者。既然大部分伟大的事无法计划，无法被设计，那么你可以通过不停的给他喂养，大量的文本，大量的数据，让他可以不断的学习，慢慢拥有智能。

比方说有个苹果，如果是个设计派，你就要教他，这是苹果，那不是苹果，就是要不停的设计；但是学习派不这样，学习派是让计算机去看大量的苹果，相当于教计算机自己来认，然后计算机看了那么多苹果之后就学习到了，这是苹果，那不是苹果。因为计算机找到规律了，自然而然就知道了苹果长什么样。虽然我们不知道计算机具体是怎么想的，但是我们现在几乎可以明确设计派是走不通的，设计派就像我们的应试教育，不停的告诉你，这是苹果，不懂就背下来哈。那什么是学习派的素质教育，就是让孩子理解大量的苹果，见过大量的苹果之后，他意识到苹果原来长这个样。各位，这像不像人大脑，所以学习派的核心理念就是计算机通过学习和模仿人类的大脑原理，通过大量的学习案例来让你理解事物，拥有人类的智能。但是人工智能早期时代，人们没有那么多数据，自然也就无法超越设计派。早期研究人工智能的大多数先驱，都认为机器是不可能自己通过模仿就拥有智能的，机器哪能像人脑子那么牛，所以一致认为机器的智能一定是人设计它这样做的，你看这是人类的骄傲所决定的，这带来了人工智能第一次危机。如果到现在你还不理解人工智能，那么我接下来争取再次通过这个积木问题把它讲明白。那个积木问题就是如何教会机器人，像小朋友一样堆积木，积木问题的目标，就是编写一个能够理解命令的程序。比如找一个大块的黄色积木，把这个黄色积木放在红色积木上边，然后把这个程序变成机器手完成动作。大家都知道这个事很简单对吧，小朋友都会啊，你让小朋友说来，把那黄色积木堆那个红色积木上面，就非常简单，对吧？但我告诉你，这个在编程里非常难。首先就光识别出黄色跟红色，就已经很困难了，更别说去搭积木了，因为你要教他什么是黄色，你怎么定义黄色。科学家编了一个庞大的程序，结果漏洞百出，所以他们看着程序崩溃，自己也开始崩溃，说这玩意咋教都教不会。你看这像不像一个家长教孩子教不会，积木问题看似简单，其实是一个在编程领域极其困难的问题，所以如果积木问题都出问题了，你让他盖房子也是天方夜谭，更别说是人工智能了。跟大家说一下2016年是怎么解决的，它也是通过大数据的深度学习，通过学习派的这种逻辑，让他认识什么叫黄色，什么是红色，才慢慢解决了。所以60年前的设计派的这帮人，遇到第一个特别大的危机，就是积木问题，不过还好有那么一小撮人，他们是坚定学习派的，他们意识到人工智能只要通过模仿人类学习的过程，一定能够找到一种行得通的算法，所以到人工智能近期，计算机科学家集中活力，进入到学习派，他们开始模仿人类的学习方法。而这期间一位伟大的教授，他来自于康奈尔大学的弗兰克，这个罗森布拉特教授非常厉害，因为他第一个实现了一个突破，他发明了一种算法叫感知器。

在1957年，感知器能完成的功能，就像是我们刚才提到如何教计算机认识苹果，通过识别大量的图片，哪些是苹果，哪些不是苹果，感知器形成一套自己的标准，它就能认出苹果了。如果它能认出苹果，那么各位它是不是就能认出坦克等等，所以感知器最先被用在了军方程序、。这个成果也上了纽约时报，一个感知器能识别出坦克，什么概念，所有的科学家看完都傻了，因为更进一步，打仗的时候他就能识别出这不是坦克，这是伪装坦克，他就能确定这个要攻击了。因为他能认出坦克，他一定能认出枪，能认出敌人，所以科学家就决定研究怎么让感知器处理更复杂的问题。不过还是决定向人学习，感知系模仿的是我们的神经元，大家如果学会一点脑科学，知道神经元组成了一个庞大的网络，这个网络在我们脑子里边，它就是我们的记忆，就是我们的生命，所以科学家也就继续朝这个神经网络方向本进发。但是在1969年，这个著名的人工智能之父——马文明斯基，大家记得吗，这个马文明斯基也是在1956年的达特茅斯人工智能夏季研究计划的发起人，他在发起的那场世纪之讨论之中写了一本叫感知器的书，这本书里有段话说，单个的感知器只能解决有限的问题，要解决复杂的问题，必须把更多的感知器连在一起，组成人工神经网络，你看这好像很对，人的大脑是这样子的，很多神经网络他也是一样，把各种感知器连在一起，所以他就在书里做了接下来这个论断，没有办法找到一种可行的算法去训练这种人工神经网络，这就相当于把人工神经网络刚告诉你，这条线可以走，然后就告诉你没办法走通。到现在，谁也不知道他为什么会写这篇文章啊，这相当于第二次危机，整整一代人的人工智能研究者，都读过这个论文，这大哥就连自己都没往上考虑。

你知道吗？有时候我在读这些历史的时候，我就特别大的感触——人类为什么会进化，人类为什么会比上一代强？它的本质就是，这一代人不听上一代人的话，结果谁也没想到，就一小撮科学家，其中就包括特伦斯切诺夫斯基，非常讨厌那个马文明斯基。他就不死心的继续研究，最后在16年之后，也就是1985年，和另外一位人工智能领域，非常优秀的专家——辛顿，他当时就提出一个算法，可以让更多的感知器共同组成一个人工智能网络，这个算法也非常有名，大家可以查一下，叫做波尔兹曼契，这个算法它打破了十多年前那位司机的预言。顺便说一下，这俩哥们还认识，这俩哥们在06年的一个大会还见过一面，当时这位马文明斯基司机当时见到特伦斯切诺夫斯基，看的都不好意思，直接掉头就走，特伦斯切诺夫斯基就跑去找那位马文明斯基说，是不是你堵死了大家的路，你得向大家道歉，然后他说就道歉了。

话说回来，找到了感知器跟感知器之间的沟通方式，计算机科学家终于可以创建庞大的人工神经网络，来处理更大的更复杂的问题。当然第二次人工智能的浪潮也就来了，这波浪潮包括智能翻译，语音识别，无人驾驶。不过在95年前后，大家又失去信心，因为大家觉得这么多年人工智能发展太慢了，他们都认为算法可行，但是没法使用。大家都知道这个东西好，但你要怎么用它是个问题，所以这一次又遇到了寒冬，人工智能这个时候什么也不能干，只能等待，等待大数据继续发展，算力系统继续优化。如果大家都听过摩尔定律，你就应该知道，芯片内的晶体管的数量增加一倍，芯片的这个运算能力就会增加一倍，每两年都会这样，这种指数增长一定会突然间变得很可怕。像10年32位人工智能最新的发展，这都是因为芯片技术越来越强大了，2012年开始，芯片技术带来了强大的算力，在深度学习的算法带领下，人工智能迎来了第三次浪潮，这是我们今天经历的人工智能浪潮，这个浪潮会刮多久呢？我不知道，但是我问了身边人，都说至少10年。

总结一下，我们从1959年到1969年，人工智能兴起了12年，然后接下来低谷期17年，86年到95年，人工智能兴起了不到10年，之后低谷期17年，然后2012年人工智能又兴起了，到如今人工智能进入高潮，几乎就是周期性的浪潮，但是大家从这波浪潮中也能看出，万事万物都是一样，一个东西起来之后它一定会下去，所以大家也不要因为一时的兴起太过激动，也不要因为一时的落寞而太过悲伤。科技如此，生活也如此。就像现在人工智能这么火，你都愿意花钱上上培训班，花钱让孩子去接触人工智能，但是我告诉大家人工智能的趋势还会下去，但过不了多久他还会上来，所以今天看到这的你们，相信我，人工智能的趋势是波浪的向前推进。只要你相信这个赛道是永恒的，人工智能就一定会再次迎来他的高潮，我原来经常会感受到我们读历史，读文学他救不了人，他只能自救；但是人工智能这个赛道，真的可以救很多人，这也是为什么我老建议大家持续学习、多接触新事物。各位，这章到此就结束了，下一章我们聊聊无人驾驶，并分享一个故事。

第4章 深度学习

第4章深度学习