前 言

我对语音信号分析的研究始于2008年。那一年,我看到了牛津大学马克斯•A.利特尔(Max A.Little)博士发表的用语音信号分析研究帕金森病诊断方法的论文,感到极为震撼。于是,我开始尝试用人工智能的方法分析语音信号与帕金森病之间的关系。

得益于我的导师洪文学教授指点,我利用计算几何方法,很快就设计出可视化分类器,并在诊断精度上超越了马克斯博士的实验结果。彼时的我开始展露出年少轻狂,不由得沾沾自喜起来。然而在与临床医生进行沟通时,我发现自己提出的方法虽然性能不错,但因解释性欠佳而不便于医生理解。从那时起,我就思考如何能让非人工智能领域的从业人员快速理解这些算法的含义。

再次得益于洪文学教授指点,我开始关注形式概念分析理论。概念是人类认识事物的最小单位,以概念为核心构造语音信号分析方法并将其应用于帕金森病诊断,将会极大提升方法的可解释性。但掌握形式概念分析理论本身需要有较高的数学知识水平,这样一来就很难满足通俗的可解释性需求。于是,我尝试将可视化方法与形式概念分析结合,以此为基础提出了属性拓扑理论,利用图的可视化特性来说明概念的形成过程,并分析其背后的认知原理,这项研究我进行了十年。

在这十年中,我并没有放弃对帕金森病语音信号分析的研究。从数据集的采集、整理,到该领域内最新方法的跟踪分析,我始终在思考如何利用属性拓扑这种可视化认知概念学习方法来解决帕金森病的构音障碍分析问题。2023年,我们终于将属性拓扑与语音信号分析融合,完成了帕金森病构音障碍的分析与表示。一个心愿得以实现,在此我要感谢栽培我的洪文学教授,以及在此过程中辛勤付出的团队成员们。

本书共14章,主要分工如下:第1章由薛在发、高乐撰写;第2章由张涛、薛在发撰写;第3章由张译文、张峻行撰写;第4章和第5章由张亚娟撰写;第6章和第11章由林丽琴撰写;第7章~第10章由孙浩撰写;第12章~第14章由田静撰写。本书由薛在发和高乐负责统筹整理和校对。

在撰写本书的过程中,我们参考了很多文献资料,从中吸取了许多学术观点,在此由衷地向这些文献的作者们表示感谢。特别感谢马克斯博士与我们分享其学术观点并提供建议。

本书的出版得到了国家自然科学基金(编号:62176229和62303396)和河北省自然科学基金(编号:F2024203014和H2023203007)的资助,在此一并表示感谢。

由于著者水平有限,加上时间仓促,书中难免存在不足之处,敬请读者批评指正。

张涛

燕山大学

2024年5月