1.2.5 机器学习

人的大脑一直是一个未解之谜。人类如何思考,人类的大脑如何工作,智能的本质是什么,是古今中外的哲学家和科学家一直在努力探索和研究的问题。早期的研究者将逻辑视为人类智慧比较重要的特征。让计算机中的人工智能程序遵循逻辑学的基本规律进行运算、归纳或推理,是许多早期人工智能研究者的最大追求。但人们很快发现,人类思考实际上仅涉及少量逻辑,大多是直觉的和下意识的“经验”。基于知识库和逻辑学规则构建的人工智能系统(例如专家系统)只能解决特定的狭小领域问题,很难被扩展到宽广的领域和日常生活中。于是,一些研究者提出了一种全新的实现人工智能的方案,那就是机器学习。

人类的聪明之处就在于可以通过既有的认知触类旁通地推理出未知的问题。如图1-9所示,人类看书(书就是数据)时,依靠自身的思考与学习从书中提炼出智慧;机器学习是让计算机利用已知数据得出适当的模型,并利用此模型对新的情境给出判断的过程。机器学习本质上是一种计算机算法,计算机通过大量样本数据的训练,能够对以后输入的内容做出正确的反馈。训练的过程就是通过合理的试错来调整参数,使得出错率降低,当出错率低到满足预期的时候,就可以拿出来应用了。机器学习分为监督式学习和非监督式学习。

图1-9 机器学习与人脑思考

机器学习的应用非常广泛,应用在文本方面就是自然语言处理,应用在图像方面就是图像(模式)识别,应用在视频上就是实体识别,应用在汽车上就是自动驾驶,等等。

机器学习重要的成果是2006年关于深度学习(Deep Learning)的突破。深度学习起源于20世纪八九十年代的神经网络研究。深度学习模型的灵感来自于人类大脑视觉皮层以及人类学习的方式,以工程化方法对功能进行简化。深度学习模型是否精确反映了人类大脑的工作方式还存在争议,但重要的是这一技术的突破让机器第一次在语音识别、图像识别等领域实现了与人类同等甚至超过人类的感知水平,从实验室走向产业,从而发挥价值。

美国大笔投资在机器学习应用上,占美国整个AI投资的21%。这一领域是仅次于芯片的吸金领域(芯片投资的占比为31%)。机器学习热潮是由三个基本因素的融合推动的:①深度学习算法的持续突破;②大数据的快速增长;③机器学习的计算加速,如GPU芯片这样的机器学习硬件,将训练时间从几个月缩短到几天、甚至几个小时。这些硬件芯片正在迅速发展,谷歌、英伟达、英特尔等公司都宣布推出下一代GPU芯片硬件,这将进一步加快训练速度的10~100倍。