第一节 基于计算机视觉技术的中医望诊图像采集

一、图像采集的环境要求和注意事项

在中医“四诊”中,望诊可以通过计算机视觉技术来智能化中医诊断。望诊是中医诊断疾病的重要依据之一,其包括舌诊、面诊等几方面。在面诊过程中,中医主要通过观察患者的面色进行诊断。面色包括色和泽,色是指青、赤、黄、白、黑五色,泽是指五色的荣润与晦暗。健康人面色红润光泽,略微带黄;患者的面色则往往发生相应的病理信息改变。中医五行说中的五脏配五色理论认为,面部的不同色各有所主,青主肝,赤主心,黄主脾,白主肺,黑主肾;还认为青色主风、寒、痛、惊风等证,赤色主热证,黄色主温热、寒湿、血虚等证,白色主虚寒证,黑色主寒、痛、劳损及血瘀等证。面部各部位色泽的信息,为诊断体内脏腑病变的定位与定性提供了部分依据。

在舌诊过程中,中医主要通过观察患者的舌苔、舌质及舌形进行诊断。如苔薄,多见于疾病初起,病邪在表,病情轻浅;苔厚,则提示病邪入里,或内有食积痰湿,病情较重。舌质绛,多为热入营血等。同时,不同性质的病邪,可常在舌上反映不同的变化。如黄苔多表示热邪内盛;舌质有瘀点或瘀斑,往往是瘀血的征象。如果舌色变化,则可提示病势进退。如舌苔由白转黄变灰黑,多为病邪由表入里,由寒化热,由轻转重;若舌苔由燥转润,由厚变薄,则属津液渐复,病邪渐退之象。

因此,可以通过采集患者面部及舌部的图像数据来智能化中医诊断。望诊图像信息采集前的环境要求如下:

1.确保光线的准确性 传统的中医利用视觉观察面色和舌象,条件是要有足够柔和的自然光,然而自然光是不断变化着的,由于人眼具有颜色恒常性,有经验的中医师在自然光线稍微差一点时,也可以进行望诊。但是图像采集设备不具备人眼这一功能,所以在拍摄面色和舌象时,需要确保光线的准确性。

2.采集室内的温度要适宜 适宜的温度可以保证患者全身上下气血畅通,皮肤和肌肉也会自然放松,患者真实的体征方能表现出来。而在温度较低的环境下,患者全身气血不畅,肌肉收缩,难以准确获取患者的体征信息,会严重影响采集到的面诊数据的准确性。

3.选择合适的拍摄设备 不同拍摄设备得到的图像数据会有较大的差距,为了便于智能化中医望诊,需要确保所采集数据的一致性。为了保证中医望诊数据的客观真实,需要选取较为高清的拍摄设备。

4.设计合适的图像采集箱 在面诊数据采集过程中,不同的光源、温度、物距等都会对图像信息造成影响,从而导致中医望诊的不确定性,所以需要设计合适的图像采集箱。图像采集箱可以固定患者的位置,这样可以避免患者面部及舌部数据受位置光距等客观因素的影响。

二、如何获取望诊图像

在中医诊断数字化过程中,医生一般通过患者的数字化图像进行望诊,望诊可以通过计算机视觉技术获取人体面色和舌象的客观化。因此,根据以上所需环境要求,选取合适的环境及硬件设备来获取望诊图像信息。

(一)光源的确定

一般认为,晴天上午10时左右的日光比较符合中医对望诊的要求,根据表3-1列出的自然光在不同时间的色温值可知,上午10时左右的色温约为5500K。另外,根据色温与显色指数的特性,色温为5000~7000K,显色指数Ra>85,是比较合适望诊的光照条件,因此选择光源时应尽量满足这一参数。

表3-1 不同时间段自然光的色温值

img

续表

img

对于望诊数据的采集,很难在固定时间的自然光下进行,因此,可以根据以上适合中医望诊的色温和显色指数来选取合适的光源。可供选择的光源类型一般有卤素灯、荧光灯和LED光源等。近年来较多的研究者使用白光发光二极管(LED)作为光源,LED光源具有显色指数高、体积小、驱动电压低、照度及色温较为稳定等优点,能保证拍摄图像时光照环境的均匀与稳定。各光源的主要性能如表3-2所示。经各光源性能对比分析,卤素灯发热大,会影响望诊图像的采集质量;荧光灯频闪,易影响拍摄效果;多个LED灯组成的光源最为适合望诊图像数据的采集。

表3-2 各光源性能比较

img
(二)温度的确定

在望诊数据采集中,适宜的温度才能使患者的真实体征表现出来。因此,应保持数据采集室内恒定的适宜温度。

(三)拍摄设备的确定

一般来说,拍摄设备的像素应不低于200万,像素越高,图像清晰度越高。现阶段一般选择高清摄像头和单反相机作为拍摄设备。高清摄像头虽然体积小,控制方便,成本低,但是图像质量不及单反相机,因此,更应选取单反相机作为图像采集拍摄设备。

1.相机镜头的选择 镜头的主要作用是折射光线,在焦点平面上汇聚成清晰的画面。由镜头中心到焦点的距离叫焦距,焦距是镜头分类的重要标准。相机镜头一般分为定焦镜头和变焦镜头。定焦镜头的焦距固定不变,光学品质较为优秀;但变焦镜头焦距可以调节,给拍摄提供了极大的便利。由于面部和舌部图像的采集需要近距离拍摄,且前期需要根据相机安装位置的实际情况调整焦距,所以选择变焦镜头。

2.相机的设置 单反相机拍摄图像时,应该预先设置好相机的各项操作功能(主要包括镜头焦距、曝光模式、测光方式、光圈系数、快门速度、景深等),然后取景、对焦和测光。拍摄距离较近时,景深会自然变小,而面部和舌部图像的采集对于景深有较严格的要求,所以通过缩小光圈来尽量延长景深。此外,拍摄图像时,为了避免患者有瞬间的移动和抖动,快门速度不能太慢,因此,曝光模式选择光圈优先模式。中央重点测光适合被摄主体位于画面中央区域,既能突出主体又兼顾周围环境,在采集患者面部和舌部图像时,画面的位置正好处于中央重点测光的范围内,因此测光方式选择中央重点测光。当相机测光后获得一定的曝光量,只需设置好光圈系数,快门速度根据曝光量可自行调节。单反相机的参数设置可参考表3-3。

表3-3 单反相机设置参数

img
(四)图像采集箱的设计

图像采集箱可以确保光源的准确性,并具有固定作用,确保望诊数据采集的一致性。箱体内部通过一块隔板分为前后两个空间,前面为光源照亮区域,后端为相机、电源等的安装空间。隔板上需要安装确定的光源;在隔板的中心位置需要设置一个大于相机镜头的孔,用于拍摄。箱体的前端是人脸贴附的一块面板,所以需要开出满足人脸要求的椭圆孔对人脸进行定位,且隔板距前端面板距离250mm,符合图像采集设备的物距需求。经过如上设置后,可以通过图像采集箱来获得患者面部和舌部图像信息用于智能化中医望诊,图像采集箱的整体结构如图3-1所示。

图3-1 图像采集箱

三、获取满足特征提取的图像

在中医采集到望诊所需的面部及舌部图像后,需要对图像数据进行包括舌在人脸中的定位、舌在复杂环境中的分割提取和舌的苔质分离的预处理,这些步骤是之后进行面色、舌象特征提取的基础。

(一)舌体图像分割

舌体的自动分割在望诊客观化研究中具有至关重要的地位,其需要将舌体的轮廓识别出来,便于后续的舌质、舌苔分离和特征提取分析过程。

1.基于阈值的分割方法 是目前最为简单、最为广泛的并行区域分割技术。在应用中通过分析图像灰度直方图获取其波峰及波谷,各组波峰及波谷均为图像一类区域表现,能够获得图像一类目标或多个目标阈值,在阈值的分析下也就能够获取图像一个或若干个部分的信息。在对不同类信息实施区分过程中也就可以实现对同类信息的合并,归类为同一类物体,以此实现对图形的目标区域划分。

2.基于区域的分割方法 图像分割中常见的一种分割方法就是区域生长法,其主要机理是由某个特定属性的像素为原点,周围相邻的像素与原点进行对比,将具有相似性质的点合并到区域内,直到没有满足条件的像素为止。因此,第一个像素的特性决定了区域生长的好坏。简而言之,由某个像素点向外辐射一定条件内的距离,这将得到一个区域,从而能够进行下一步的分割操作。

3.基于聚类的分割方法 聚类就是将未知类数据在不同类或簇中实施分类的过程,其中集中在同一类中的对象相似性比较高,不同类对象间存在较大的相异性。基于聚类的分割算法是依照相应特征空间实现对图像时域中像素的聚类分析,对于存在有相同特征像素的所处特征空间也就能够实施聚类,也可以实施分割。

利用以上三种分割方法可以实现对舌象的精确分割。

(二)基于K-均值聚类的舌质、舌苔图像分离

在中医学相关研究中,舌诊是医生分析和诊断疾病的重要依据,考察的对象主要是舌头的形状、色泽,舌苔的厚薄、颜色及舌质、舌苔的分布状态等。利用计算机图像处理技术对分割后的舌体图像进行苔质分离,有利于进一步实现舌苔与舌质的特征提取与分析,对舌诊的智能化研究具有重要意义。

CIELab颜色空间中的a分量对舌质图像中的红色很敏感,且该颜色空间的颜色变化均匀,因此可采用基于a分量的K-均值聚类算法实现舌质、舌苔的分离。该方法的流程图如图3-2所示。

苔质分离过程主要实现步骤如下:

(1)首先将输入的分割舌体图像进行CIELab颜色空间转换,并使用大津算法对a分量的舌体图像进行二值化。

(2)在二值化后的舌体图像中选取合适的种子点,对提取的a分量的舌体图像进行K-均值聚类。

(3)基于K-均值聚类方法,不断调整聚类中心,得到最优的聚类结果,生成舌质与舌苔的Mask。

(4)利用生成的Mask从原始舌体分割图像中获取对应的舌质与舌苔图像。

图3-2 舌质、舌苔分离过程