技术创新篇

第三章 机器学习算法

第一节 总体发展概况

机器学习是一门复杂的交叉学科,涉及较多的数学学科,如概率论、统计学、逼近论、凸分析、算法复杂性理论等,专注于模拟或实现人类的学习行为,机器自动获取新的知识或技能,是机器智能化道路上迈出的重要一步。机器学习的历史可以追溯到1950年之前,但是直到20世纪80年代,由于神经网络研究的重新兴起以及实验研究和应用研究被重视起来,机器学习才作为单独的学科得到确立,并在20世纪90年代和21世纪初得到快速发展,从而出现了符号学习、神经网络学习、进化学习和基于行为主义的强化学习等百家争鸣的局面。机器学习是当前解决人工智能问题的主要技术,在整个人工智能技术框架中处于十分重要的基础与核心地位,在大数据的支撑下,通过各种算法让机器对数据进行深层次的统计分析以进行“自学”,机器通过学习算法获得了归纳推理和决策能力。

依据样本数据是否带有标签值,可以将机器学习算法分为有监督学习与无监督学习。而强化学习是一种于近期出现的特殊机器学习算法,通常将其作为机器学习算法中的第三大类。有监督学习的样本数据带有标签值,它从训练样本中学习得到一个模型,然后使用该模型对新的样本进行预测推断,样本由输入值与标签值组成,现在很多领域如垃圾邮件分类、手写文字识别、人脸识别、语音识别等领域的人工智能算法大多是有监督学习。按问题类型分为分类问题与回归问题,按模型类型分为生成模型与判别模型。

深度学习是机器学习算法中有监督学习的一种,属于神经网络体系。之所以叫做神经网络,是因为大部分应用领域中的机器学习算法都是模仿人类大脑结构的神经网络设计的,这些人工智能神经网络能够通过大量的数据发现其中的规律,逐渐迭代自身知识体系,学习并应用规则。深度学习通过建立、模拟人脑的信息处理神经结构来实现对外部输入的数据进行从低级到高级的特征提取,从而能够使机器理解学习数据。具有多个隐藏层的神经网络又被称为深度神经网络,深度学习在解决更复杂的问题上表现更优异,通过机器学习技术,计算机获得了如同人类一样的归纳推理和决策能力,深度学习技术则让计算机获得了更加强大的学习能力。目前,卷积神经网络作为最有效的深层神经网络,其应用范围和应用领域越来越广,并且智能化程度越来越高,AlphaGo、SIRI和脸书等人工智能系统都应用了卷积神经网络。在中国目前非常受关注的智能制造领域中,工业机器人是卷积神经网络应用的经典案例,通过深度学习训练的工业机器人能够更好地适应外部环境的变化。人工智能、机器学习、强化学习、深度学习关系图如图3-1所示。

图3-1 人工智能、机器学习、强化学习、深度学习关系图

(数据来源:CCID赛迪智库,2019年9月)