- 深度学习之图像目标检测与识别方法
- 史朋飞等
- 1862字
- 2024-10-18 15:06:01
0.2.3 裂缝图像分割算法研究
裂缝图像分割算法可分为形态学方法和深度学习方法两类[45]。在深度学习方法流行前,形态学方法是研究人员利用数字图像处理、拓扑学、数学等方面知识来实现图像分割的主要方法[46]。这类方法容易受图像质量、噪声等因素的影响,对使用环境有较高的要求。相较于深度学习方法,形态学方法的适用性较差,其分割性能和深度学习方法存在着一定的差距。
随着深度学习的不断发展,越来越多的研究人员将其应用到裂缝图像分割任务中[47]。裂缝因其纹理特征较为复杂,对模型的分割性能提出了较高的要求。目前,在裂缝图像分割领域中,应用较多的是全卷积网络(Fully Convolutional Network,FCN)及其变体[48]。FCN于2015年由Long等人[49]提出,由编码器子网络和解码器子网络两部分构成。其中,编码器子网络用于提取图像特征,解码器子网络负责对图像像素进行分类。由于FCN的解码器子网络过于简单,其分割效果并不理想,常常出现误判的情况。
Ronneberger等人[50]在FCN基础上提出了UNet,它通过跳跃连接(Skip Connection,也称为跳层连接)实现了医学图像不同层特征在语义上的融合。与 UNet 类似的还有SegNet[51],SegNet 使用编码器子网络池化操作生成的索引实现了图像语义特征的融合。与FCN相比,这些改进的算法将网络结构改成了对称结构,丰富了解码器子网络输出的语义特征,有效提升了图像分割的精度。
虽然UNet和SegNet的提出并不是为了解决水下大坝裂缝图像分割问题,但它们的有效性已经取得了证明。Huyan Ju等人[52]基于UNet提出了一种改进的道路裂缝图像分割网络——CrackUNet,借助填充(Padding)操作,CrackUNet可以保持特征图(Feature Map)的尺寸不变。Cheng等人[53]基于UNet提出了一种像素级道路裂缝图像分割方案,通过引入基于距离变换的损失函数(Loss Function based on Distance Transform),该方案取得了较高的像素级精度(Pixel-Level Accuracy)。Li 等人[54]在SegNet 的基础上融入Dense Block,提出了一种新的混凝土结构裂缝图像检测算法。Zou等人[55]将多尺度特征跨层融合应用到了SegNet中,提出了一种名为DeepCrack的裂缝图像检测算法。
虽然上述方法可以有效提升地面裂缝图像的分割精度,但将它们直接应用到水下大坝裂缝图像分割任务中还存在一些问题。由于上述方法均属于有监督学习方法,其模型训练需要大量的有标签数据。鉴于水下大坝裂缝图像获取困难、数据集标注耗时费力,对水下大坝裂缝图像分割采用有监督学习是难以实现的。
水下大坝裂缝图像不同于地面裂缝图像,由于图像采集系统的限制,大部分水下图像质量较差[56]。水下大坝裂缝图像的对比度低,所含的信息量较少,且含有大量的随机噪声和黑点,这给裂缝图像的特征提取和分割带来了很大的困难[57]。常规的处理水下大坝裂缝图像的方法为:首先对原始图像进行图像增强,然后对增强后的图像进行分割。马金祥等人[58]提出了一种基于改进暗通道先验的水下大坝裂缝图像自适应增强算法,该算法可以有效抑制水下图像的噪声,增加图像的清晰度。陈文静[59]提出了一种基于导向滤波的 Retinex 算法,在进行水下图像滤波的同时,有效保留了图像的边缘信息。Chen等人[60]提出了一种新的水下大坝裂缝图像检测算法,该算法将2D的裂缝图像按像素强度(Pixel Intensity)转换为3D 的空间曲面,通过分析曲率特征来检测水下大坝裂缝图像。这些算法虽然在一定程度上改善了水下大坝裂缝图像的检测效果,但准确度仍然有待提高。
图像增强结合形态学方法是处理水下大坝裂缝图像分割问题的最常用方法之一,但这种方法的分割性能受图像增强效果的影响较大,且自适应性较差。因此,本书通过深度学习方法实现水下大坝裂缝图像分割,以提升算法的自适应性和分割精度。目前,开源的水下大坝裂缝图像数据集很少,而深度学习对数据集的要求很高,数据集不充足很可能导致模型训练不充分,最终导致水下大坝裂缝图像分割效果较差。因此,使用深度学习方法处理水下大坝裂缝图像分割任务,需要考虑样本不足的问题。
由于直接使用有监督学习方法处理各类学习任务常常会面临数据样本不充分的问题,所以研究人员提出了一些解决方案,例如半监督学习、小样本学习和迁移学习等。半监督学习[61]通过提取并学习具有相同分布的有标签数据和无标签数据的特征,可以在降低对样本标签数量需求的同时,保证模型的性能。小样本学习[62]通过将预训练模型在少量的带有标签的目标域数据上做进一步训练,可实现对目标域上特定任务的学习。迁移学习[63]是一种应用较为宽泛的学习方法,该方法将模型在源域上进行预训练时学习到的先验知识应用到目标域的学习任务中,可以有效缩短训练时长,并保证模型的精度。相较于半监督学习,迁移学习的优势是有标签的源域数据和无标签的目标域数据的分布可以不一致。迁移学习经过多年发展,已经衍生出多个分支。深度迁移学习在图像目标分类[64]、语义分割[65]等多个领域取得了令人满意的结果。