1.5 迁移学习的应用
迁移学习是机器学习领域的一个重要分支,其应用并不局限于特定的领域。凡是符合迁移学习问题情景的应用,迁移学习都可以发挥作用。这些领域包括但不限于计算机视觉、文本分类、行为识别、自然语言处理、室内定位、视频监控、舆情分析、人机交互等。图1.7展示了迁移学习已经被广泛应用的领域。下面我们选择几个研究热点,简单介绍迁移学习在这些领域的应用场景。
需要指出的是,本小节的应用只是简单举例,为读者说明迁移学习潜在的应用问题。更多更详细的应用问题,读者可以移步第15章,在此章中,我们将会更加细致地介绍更多的迁移学习应用问题和解决方案。
图1.7 迁移学习的应用领域概览
1.5.1 计算机视觉
迁移学习已被广泛地应用于计算机视觉的研究中,例如图片分类、风格迁移等。图1.8展示了不同的迁移学习图片分类任务。同一类图片,不同的拍摄角度、不同光照、不同背景,都会造成特征分布发生改变。因此,使用迁移学习构建跨领域的鲁棒分类器是十分重要的。图1.8(a)中的手写体数据分别来自经典数据集MNIST和USPS,图1.8(b)中的图像数据则来自迁移学习公开数据集Office-Home [Venkateswara et al.,2017]。
图1.8 迁移学习在视觉领域的应用
计算机视觉三大顶会(CVPR、ICCV、ECCV)每年都会发表大量的文章对迁移学习在视觉领域的应用进行介绍。特别地,[Xie et al.,2016]利用迁移学习和计算机视觉技术帮助联合国预测非洲地区的贫困情况。研究者从非洲大陆的卫星图上获取其夜间灯光的图像,然后将这些灯光图像亮度级别与ImageNet大型图像分类数据集进行映射。经过细致的训练调优后,研究成果表明仅靠迁移学习和计算机视觉技术,就取得了与实地调研相匹敌的结果。这显示了迁移学习在社会应用中的影响。
有关迁移学习在计算机视觉领域的更多应用,请读者移步15.1节。
1.5.2 自然语言处理
自然语言处理领域也有着大量迁移学习的应用。以文本分类为例,由于文本数据有其领域特殊性,因此,在一个领域上训练的分类器,不能直接拿来作用到另一个领域上,这就需要用到迁移学习。图1.9是一个由电子产品评论迁移到DVD评论的迁移学习任务。在图中展示的问题中,在电子产品评论文本数据集上训练好的分类器,不能直接用于DVD评论的预测,这就需要在两种领域上进行迁移学习。
另外,机器翻译、摘要生成、序列标记等领域也有大量的迁移学习应用。例如,最近OpenAI发布的GPT-3(Generative Pre-training)[Brown et al.,2020]模型将预训练这一迁移学习技术应用于各项自然语言处理任务,取得了领先的成果。
图1.9 迁移学习文本分类任务
通常,自然语言处理不仅包括文本这一信息载体,也包括语音。因此,在语音识别、语音合成等领域中,迁移学习也有着举足轻重的应用。例如,[Li et al.,2019a]把为普通话训练的语音识别模型迁移到广东话的语音识别上,获得了很好的识别效果。在那些小语种的语音识别与合成任务上,迁移学习几乎是唯一可用的学习技术。
自然语言处理和语音识别的国际会议(ACL、EMNLP、NACCL、Interspeech、ICASSP)每年均有相当数量的论文介绍该领域的研究进展。有关迁移学习在自然语言处理领域的更多应用,请读者移步15.2节;关于迁移学习在语音领域的应用,请读者移步15.3节。
1.5.3 普适计算与人机交互
行为识别(Activity Recognition)主要通过佩戴在用户身体上的传感器研究用户的行为。行为数据是一种时间序列数据,不同用户、不同环境、不同位置、不同设备,都会导致时间序列数据的分布发生变化,此时,也需要进行迁移学习(参见图1.10)。图1.10(a)展示了同一用户不同位置的信号差异性。在这个领域,华盛顿州立大学的Diane Cook等人在2013年发表的关于迁移学习在行为识别领域的综述文章[Cook et al.,2013]是很好的参考资料。近年来,行为识别通常应用在深度学习网络中,笔者所在团队于2018年发表的深度学习用于行为识别的综述文章[Wang et al.,2019c]也可以作为入门的参考资料之一。另外,[Wang et al.,2018c,Wang et al.,2018a,Qin et al.,2019,Chen et al.,2019f]等均是将迁移学习应用于行为识别领域的相关文章。
图1.10 迁移学习在普适计算与人机交互领域的应用
室内定位(Indoor Location)与传统的室外GPS定位不同,它通过WiFi、蓝牙等设备研究人在室内的位置。不同用户、不同环境、不同时刻也会使得采集的信号分布发生变化。图1.10(b)展示了当定位设备(AP,Access Point)处于不同地点(Research Lab、Hall、Corridors)时,由于其读数的分布发生变化,室内定位模型的误差也发生了变化。
普适计算和人机交互领域顶级会议(UbiComp、CHI、PerCom)每年均有一定数量的文章介绍迁移学习在这些领域的应用。有关迁移学习在普适计算和人机交互领域的更多应用,请读者移步15.4节。
1.5.4 医疗健康
医疗健康领域的研究正变得越来越重要。不同于其他领域,医疗领域研究的难点问题是,无法获取足够有效的医疗数据。在这一领域,迁移学习同样也变得越来越重要。
最近,顶级生物期刊《细胞》杂志报道了由张康教授领导的广州妇女儿童医疗中心和加州大学圣迭戈分校团队的重磅研究成果:基于深度学习开发出的一个能诊断眼病和肺炎两大类疾病的AI系统[Kermany et al.,2018],准确性匹敌顶尖医生。这是中国研究团队首次在顶级生物医学杂志发表有关医学人工智能的研究成果,也是世界范围内首次使用如此庞大的标注好的高质量数据进行迁移学习,并取得高度精确的诊断结果,达到匹敌甚至超越人类医生的准确性,还是全世界首次实现用AI精确推荐治疗手段。《细胞》杂志封面报道了该研究成果。
医疗健康是一个交叉学科,因此,除医学专业会议MICCAI外,计算机视觉、自然语言处理、人机交互等领域每年均有一定数量的相关研究。有关迁移学习在医疗健康领域的更多应用,请读者移步15.5节。
可以预见的是,迁移学习对于那些不易获取标注数据的领域将会发挥越来越重要的作用。
本小节仅对迁移学习的应用抛砖引玉,更详细的应用请移步本书第15章。在第15章中,读者将会发现,迁移学习不仅在计算机相关领域,还在物理学、天文学、农业、金融、生物学、交通运输业、在线教育、物流等领域均有成功的应用。