1.6 本书的内容及结构

本书内容涉及生态学、神经学、生物学、运筹学、计算机科学等多学科交叉,主要借助生物学免疫系统的机理,通过构造新的算子和算法,将免疫计算智能与机器学习中的数据约简、数据分类、关联规则挖掘、聚类分析及大数据分析等应用进行结合,将有关免疫计算智能的算法及技术运用于工程应用领域,发展出解决实际问题的新方法、新理论,以丰富机器学习与免疫计算智能的研究内容,拓展了机器学习软计算方法的设计与实现。

全书分为七章,具体内容如下。

第1章:绪论。本章在简单介绍人工智能和机器学习的概念、发展的基础上,分别阐述了人工智能、数据挖掘、仿生计算智能与机器学习的关系。重点介绍了基于仿生计算原理的免疫计算在机器学习领域的基本概念、特性和发展,介绍人工智能、大数据发展趋势及对机器学习的挑战。最后给出了本书的基本结构和各章节的主要内容,方便指导读者阅读。

第2章:机器学习主流技术与方法。本章将结合机器学习最新发展,简要阐述当前机器学习领域的主要技术和方法,主要包括对传统机器学习的数理统计方法及软计算方法,包括粗糙集、遗传算法、神经网络、支持向量机等,还对近十年来重要且主流的机器学习技术,包括度量学习、多核学习、多视图学习、集成学习、主动学习、强化学习和迁移学习等进行了简单介绍。探讨了多种机器学习模式,如监督学习、弱监督学习、半监督学习、流数据挖掘、社会网络分析等,以及如何与实际应用结合、解决现实问题的需要。

第3章:免疫计算的基础原理。介绍了生物免疫系统的结构和组成、免疫系统的工作机制,以及生物免疫学理论中的各种理论,对生物免疫系统形成一个全面的了解。研究和讨论了免疫机器学习的模型、原理及工作机制,为本书的后续研究提供了理论基础。

第4章:基于免疫聚类竞争的关联规则挖掘方法。针对数据挖掘中的关联规则挖掘广度及效率问题,利用免疫抗原与抗体对应于数据原记录和候选模式,在基于克隆选择原理免疫算法的基础上引入了聚类竞争机制,加速抗体亲和力的成熟,提高全局搜索能力。这种机制提高了抗体群的多样性,避免了抗体群被少数亲和力最高的抗体占满,从而提高关联规则获取的效能。通过实验可以发现基于免疫关联规则挖掘算法具有收敛速度快的特点,而且此算法同时具有相当好的全局及局部搜索能力,这样可以得到更多符合条件的关联规则。

第5章:基于小生境免疫粗糙集属性约简方法。围绕数据挖掘中的高维数据属性约简难题,在粗糙集核属性的基础上,融合小生境免疫优化提出一种决策属性约简方法。将粗糙集核属性参数作为抗体编码的先验信息,通过疫苗自适应提取算法对抗体群接种疫苗,提高抗体群的多样性及稳定性。为降低属性约简的计算复杂度,引入属性集合的分类近似标准作为免疫优化的亲和度,采用小生境免疫共享机制动态调整抗体群的亲和力,提高算法局部搜索能力。通过免疫记忆算子操作促使优良个体的保存,在保证收敛速度的同时具有较强的全局和局部寻优能力。通过滚动轴承故障诊断及UCI数据集的属性约简实验,显示本算法在属性约简精度和效率方面具有较好效果。

第6章:基于免疫阴性选择的数据分类器。根据免疫否定选择原理,设计了基于掩码分段匹配的否定选择分类器,克服连续r位匹配法的缺陷,给出了适用于免疫优化的分类规则编码及分类信息分的评价。通过免疫进化对其进行群体优化以约简数据规则集,避免了传统分类算法缺乏全局优化能力的缺点,提高了对样本的识别能力。将该分类器用于实现文本匹配选择分类,克服传统否定选择分类方法对大样本空间分类效果不好的缺点。实验结果表明本书方法提高了数据分类的准确性,在数据分类准确率及平均信息分上优于传统的分类方法。

第7章:免疫网络在生物信息学中的应用。根据免疫网络优秀的分类机理,研究了aiNet聚类模型和AIRS分类算法,提出了基于免疫进化网络的分类器。该分类方法主要采用免疫记忆池的两次网络抑制操作来改善网络结构,使记忆细胞在“特异性”与“通用性”之间得到平衡,同时采用离散增量度量亲和力,克服生物信息数据挖掘应用中DNA序列的特征提取和亲和力度量对分类性能的影响,提高分类器泛化性能,更好地衡量序列之间的相似性。

最后为全书总结,结合大数据应用需求,介绍了未来机器学习技术的主要发展方向、对免疫计算的机器学习方法的研究,以及未来需重点突破的内容。