2.3 基于张量排序保留判别分析的人脸特征提取

子空间学习方法是一种典型的图像特征提取方法,人们对它的研究已经有了近百年的历史[36]。通过子空间学习方法,可以找到新的子空间,样本在新的子空间的距离可以反映样本间的相似性(similarities),从而提升分类准确率。

由于高维欧氏空间中有测量集中现象(concentration of measure phenomenon)[37],即高维空间中样本间的区分度会变差。实验表明,样本排序信息可以缓解测量集中现象[38-40]。很多无监督的子空间学习方法保留了样本排序信息,如多维尺度分析方法(Multidimensional Scaling,MDS)[41],通过保持子空间样本间距离和原始空间样本间距离一致来保留样本排序信息。监督的子空间学习方法在学习子空间时利用了训练集的标注信息,这类方法更适合应用于分类问题。由于学习的子空间中样本分布和原始空间中样本分布一般不同,忽略类间样本的排序信息是合适的[42]

上述关于排序信息保留的子空间学习方法都是在假设样本为向量的情况下讨论的。对于图像分类问题,由于图像的数学表示为张量,若先将图像样本拉长成向量,再研究子空间学习方法,不仅会破坏原始样本的空间结构,使得方法性能下降,还会使得维数灾难问题更严重。因此,更一般地,可直接研究假设样本可表示为张量情况下的子空间学习方法。

在样本为向量的情况下,块配准框架(Patch Alignment Framework,PAF)[43]常用来诠释局部块上同类样本间的排序信息和不同类样本间的判别信息,其可在理论上帮助理解不同子空间学习方法的共同思想和本质差异。

针对人脸识别问题,本节介绍基于张量块配准框架(Tensor Patch Alignment Framework,TPAF)的张量排序保留判别分析模型(Tensor Rank Preserving Discriminant Analysis,TRPDA),并介绍TRPDA算法及解法。通过引入距离惩罚函数,来保留局部块上同类样本的排序信息。由于学习的子空间中样本分布和原始空间中样本分布一般不同,在提取类间判别信息时无须考虑块间样本的排序信息。TPAF 框架可以有效地把局部块中类内排序信息保留和类间判别信息提取结合在一起表示。

本节将TRPDA算法应用于人脸识别,数据库包括UMIST数据库[44]、ORL数据库[45]及CAS-PEAL-R1表情和距离数据库[46]。UMIST数据库和ORL数据库是两个经典的公开人脸数据库,CAS-PEAL-R1表情和距离数据库是近期提出的规模相对较大的公开人脸数据库。UMIST数据库包括20类人脸,共575张样本。ORL数据库包括40类人脸,共400张样本。CAS-PEAL-R1表情和距离数据库包括1340类人脸,共4085张样本。本节进行了六种经典的向量子空间学习算法和五种张量子空间学习算法与 TRPDA 在最近邻分类器(NearestNeighborule,NN)下的性能测试。实验结果表明,TRPDA 的分类性能相对于其他算法具有优越性,和基于张量的子空间学习算法相比,实验结果还表明了TRPDA的计算成本较低。