2.2 属性拓扑的定义

在形式背景中属性对间的所有关系可以分为三种:包含关系、相容关系和互斥关系。属性对的这三种关系使用数学语言定义如下。

定义2-1 已知为一个形式背景,属性

(1)若,则称属性与属性构成互斥关系。

(2)当条件0不成立时:

a.若,即,则称属性包含于属性,或者称属性包含属性

b.若,即,则称属性包含于属性,或者称属性包含属性

以上两点统称为属性与属性构成包含关系。

(3)当条件(1)和(2)不成立时,称属性与属性构成相容关系。

根据上面的定义可以看出,属性对的三种关系都可以通过计算属性对所属对象集的交集进行判别,并且这三种关系可以涵盖所有属性对的关系。

例2-1 表2-2给出了一个简单的形式背景,求这些属性可以构成多少个属性对,并分别判断这些属性对之间的关系。

表2-2 简单的形式背景示例

:按照组合数学中的组合问题求解,可知3个属性可以构成的属性对的个数为

首先,计算属性与属性的关系:

因为,所以属性与属性构成相容关系。

然后,计算属性与属性的关系:

因为,所以属性与属性构成包含关系。

最后,计算属性与属性的关系:

则属性与属性构成互斥关系。

通过定义和示例不难求出各个属性对的关系,但在传统的形式背景表示法中,并不能直观地体现属性对的关系,为了更好地表示形式背景中属性对间的各种关系和关联,现在给出属性拓扑的定义。

定义2-2 属性拓扑(Attibute Topology,AT)以形式背景中的属性为核心,对于一个形式背景,属性拓扑的邻接矩阵表示法定义为,其中:

(1)为顶点集合,通常情况下,取属性集合为顶点集合

(2)阶矩阵,矩阵中的每个元素代表从属性指向属性边上的权值,则

(2-1)

由于属性对的无序性,若则属性和属性无法组成属性对,此时规定

(2-2)

以属性对所属对象间的包含关系、相容关系和互斥关系为基础,生成的一种广义图结构。

我们先来直观地认识一下属性拓扑,以表2-2所示形式背景为例,可得其属性拓扑图如图2-1所示。图中的圆圈表示顶点,分别代表三个属性,三个属性之间的连线是带有方向和权值的边。

图2-1 属性拓扑图

从图论的角度来看,属性拓扑是关于属性间关系的加权图表示。属性拓扑有多种表示方法,如邻接矩阵表示法、关联矩阵表示法及邻接表表示法等,本书中仅介绍较易理解的邻接矩阵表示法和关联矩阵表示法。

接下来,让我们结合属性拓扑的邻接矩阵表示法,具体分析属性拓扑是如何表示属性间的三种关系的。

(1)假设属性与属性构成互斥关系,即。此时,即属性与属性之间不存在边。

(2)假设属性与属性构成包含关系。

a.若属性与属性相互包含,即,则,即属性与属性之间为双向边。

b.设属性包含属性,即。此时,即属性与属性之间为从属性指向属性的单向边。

c.同理,若属性包含属性,即属性与属性之间为从属性指向属性的单向边。

(3)假设属性与属性构成相容关系,则,即属性与属性之间为双向边。

因此,在属性拓扑中不同属性(顶点)之间的连线表示了属性对的不同关系,并以权值的形式给出了属性间的耦合信息。

在图2-1中,属性ab满足相容关系;属性c为属性a的伴生属性,包含于属性a;属性bc满足互斥关系。由属性拓扑的定义可知,属性拓扑理论强调属性的不可划分性。因此在表示过程中,每个属性作为数据表示的基本单位分析属性间的关系,属性之间的相容、互斥、包含关系重要性相同,并列存在。

从集合角度来看,设, , ,则其在属性拓扑中的二元关系可以理解为

(2-3)

属性ab对应的对象全集可以分为地位相同、相互并列的三个部分,即,三者重要性相同,不存在覆盖与包含关系。如图2-2所示,属性ab作为分析的基本单位,不可拆分,表示属性ab间的耦合关系,对应属性ab的共有对象,这是其与属性偏序的本质区别。

图2-2 属性拓扑二元关系

属性拓扑的关联矩阵表示法定义为,这种表示法只描述属性对之间的关系,其中

(2-4)

至此,对于一个已知的形式背景,结合其邻接矩阵和关联矩阵可以简单方便地得到其属性拓扑图。将所有属性作为属性拓扑的顶点,先按照关联矩阵依次画出各属性间的边及指向,再按照邻接矩阵的值标注属性间边的权值。同时,属性拓扑为带有自环的加权图表示,任意属性的自环即。为了表示的简洁性,作图时暂不考虑自环情况。

例2-2 对于表2-1中给出的形式背景:

(2-5)

对应的邻接矩阵和关联矩阵如下:

(2-6)

(2-7)

根据式(2-6)及式(2-7),容易画出属性拓扑图如图2-3所示。从图中可以通过边的方向清晰地看出属性对之间的关系,以及耦合强度等信息。

图2-3 表2-1对应属性拓扑图

性质2-1 属性拓扑与形式背景是一一对应的。

证明:显然,邻接矩阵与属性拓扑是一一对应的,因此只需证明形式背景与邻接矩阵的唯一对应性。

由于式(2-1)包含了所有属性对的关系,因此由一个形式背景一定可以得到唯一确定的邻接矩阵Edge;反之,由属性邻接矩阵求形式背景,由于其保存了属性的自环信息,只需将邻接矩阵的主对角线元素列出,即可恢复原形式背景。

属性拓扑定义,显然有以下性质。

性质2-2 具有下列性质。

(1)反映了属性对的耦合关系。

(2)反映了属性对的耦合程度。

(3)

(4)