2.8 图结构_Java常用算法手册（第3版）-QQ阅读男生玄幻网

书名：Java常用算法手册（第3版）
作者名：宋娟
本章字数：5596字
更新时间：2021-03-29 11:50:34

2.8　图结构

图（Graph）结构也是一种非线性数据结构，图结构在实际生活中具有丰富的例子。例如，通信网络、交通网络、人际关系网络等都可以归结为图结构。图结构的组织形式要比树结构更为复杂，因此，图结构对存储和遍历等操作具有更高的要求。

2.8.1　什么是图结构

前面介绍的树结构的一个基本特点是数据元素之间具有层次关系，每一层的元素可以和多个下层元素关联，但是只能和一个上层元素关联。如果将此规则进一步扩展，也就是说，每个数据元素之间可以任意关联，这就构成了一个图结构。正是这种任意关联性导致了图结构中数据关系的复杂性。研究图结构的一个专门理论工具便是图论。

图2-26　典型的图结构

典型的图结构，如图2-26所示。一个典型的图结构包括如下内容。

・顶点（Vertex）：图中的数据元素。

・边（Edge）：图中连接这些顶点的线。

所有的顶点构成一个顶点集合，所有的边构成边集合，一个完整的图结构由顶点集合和边集合组成。图结构在数学上一般记为以下形式：

G=（V，E）

或者

G=（V（G），E（G））

其中，V（G）表示图结构中所有顶点的集合，顶点可以用不同的数字或者字母来表示。E（G）是图结构中所有边的集合，每条边由所连接的两个顶点表示。

注意：图结构中顶点集合V（G）必须为非空，即必须包含一个顶点。而图结构中边集合E（G）可以为空，此时表示没有边。

例如，对于图2-26所示的图结构，其顶点集合和边集合如下：

V（G）={V1，V2，V3，V4，V5，V6}

E（G）={（V1，V2），（V1，V3），（V1，V5），（V2，V4），（V3，V5），（V4，V5），（V4，V6），（V5，V6）}

2.8.2　图的基本概念

图论是专门研究图结构的一个理论工具。为了讲解和读者理解的方便，这里简单介绍一些基本的图结构概念。

1）无向图

如果一个图结构中，所有的边都没有方向性，那么这种图便称为无向图。典型的无向图，如图2-27所示。由于无向图中的边没有方向性，这样，在表示边的时候对两个顶点的顺序没有要求。例如，顶点V1和顶点V5之间的边，可以表示为（V1，V5），也可以表示为（V5，V1）。

对于图2-27所示的无向图，对应的顶点集合和边集合如下：

V（G）={V1，V2，V3，V4，V5}

E（G）={（V1，V2），（V1，V5），（V2，V4），（V3，V5），（V4，V5），（V1，V3）}

2）有向图

如果一个图结构中，边有方向性，那么这种图便称为有向图。典型的有向图，如图2-28所示。由于有向图中的边有方向性，这样，在表示边的时候对两个顶点的顺序有要求。并且，为了同无向图区分，采用尖括号表示有向边。例如，<V3，V4>表示从顶点V3到顶点V4的一条边，而<V4，V3>表示从顶点V4到顶点V3的一条边。<V3，V4>和<V4，V3>表示的是两条不同的边。

对于图2-28所示的有向图，对应的顶点集合和边集合如下：

V（G）={V1，V2，V3，V4，V5，V6}

E（G）={<V1，V2>，<V2，V1>，<V2，V3>，<V3，V4>，<V4，V3>，<V4，V5>，<V5，V6>，<V6，V4>，<V6，V2>}

图2-27　典型的无向图

图2-28　典型的有向图

3）顶点的度（Degree）

连接顶点的边的数量称为该顶点的度。顶点的度在有向图和无向图中具有不同的表示。对于无向图，一个顶点V的度比较简单，其是连接该顶点的边的数量，记为D（V）。例如，在图2-27所示的无向图中，顶点V4的度为2，而V5的度为3。

对于有向图要稍复杂些，根据连接顶点V的边的方向性，一个顶点的度有入度和出度之分。

・入度是以该顶点为端点的入边数量，记为ID（V）。

・出度是以该顶点为端点的出边数量，记为OD（V）。

因此，有向图中，一个顶点V的总度便是入度和出度之和，即D（V）=ID（V）+OD（V）。例如，在图2-28所示的有向图中，顶点V3的入度为2，出度为1，因此，顶点V3的总度为3。

4）邻接顶点

邻接顶点是指图结构中一条边的两个顶点。邻接顶点在有向图和无向图中具有不同的表示。对于无向图，邻接顶点比较简单。例如，在图2-27所示的无向图中，顶点V1和顶点V5互为邻接顶点，顶点V2和顶点V4互为邻接顶点等。另外，顶点V1的邻接顶点有顶点V2、顶点V3和顶点V5。

对于有向图要稍复杂些，根据连接顶点V的边的方向性，两个顶点分别称为起始顶点（起点或始点）和结束顶点（终点）。有向图的邻接顶点分为如下两类。

・入边邻接顶点：连接该顶点的边中的起始顶点。例如，对于组成<V1，V2>这条边的两个顶点，V1是V2的入边邻接顶点。

・出边邻接顶点：连接该顶点的边中的结束顶点。例如，对于组成<V1，V2>这条边的两个顶点，V2是V1的出边邻接顶点。

5）无向完全图

如果在一个无向图中，每两个顶点之间都存在一条边，那么这种图结构称为无向完全图。典型的无向完全图，如图2-29所示。

理论上可以证明，对于一个包含N个顶点的无向完全图，其总的边数为N（N-1）/2。

6）有向完全图

如果在一个有向图中，每两个顶点之间都存在方向相反的两条边，那么这种图结构称为有向完全图。典型的有向完全图，如图2-30所示。

理论上可以证明，对于一个包含N个顶点的有向完全图，其总的边数为N（N-1），无向完全图的两倍。

图2-29　无向完全图

图2-30　有向完全图

7）子图

子图的概念类似子集合，由于一个完整的图结构包括顶点和边，因此，一个子图的顶点和边都应该是另一个图结构的子集合。例如，图2-31中，图（a）为一个无向图结构，图（b）、图（c）和图（d）均为图（a）的子图。

这里需要强调的是，只有顶点集合是子集的，或者只有边集合是子集的，都不是子图。

图2-31　子图

8）路径

路径即图结构中两个顶点之间的连线，路径上边的数量称为路径长度。两个顶点之间的路径可能途经多个其他顶点，两个顶点之间的路径也可能不止一条，相应的路径长度可能不一样。

图结构中的一条路径，如图2-32所示。这里粗线部分显示了顶点V5到V2之间的一条路径，这条路径途经的顶点为V4，途经的边依次为（V5，V4）、（V4，V2），路径长度为2。

图2-32　图结构中的一条路径

同样，还可以在该图中找到顶点V5到V2之间的其他路径，分别为：

・路径（V5，V1）、（V1，V2），途经顶点V1，路径长度为2。

・路径（V5，V3）、（V3，V1）、（V1，V2），途经顶点V1和V3，路径长度为3。

图结构中的路径还可以细分为如下三种形式。

・简单路径：在图结构中，如果一条路径上顶点不重复出现，则称为简单路径。

・环：在图结构中，如果路径的第一个顶点和最后一个顶点相同，则称之为环，有时也称为回路。

・简单回路：在图结构中，如果除第一个顶点和最后一个顶点相同，其余各顶点都不重复的回路称为简单回路。

9）连通、连通图和连通分量

通过路径的概念，可以进一步研究图结构的连通关系，主要涉及如下内容：

・如果图结构中两个顶点之间有路径，则称这两个顶点是连通的。这里需要注意连通的两个顶点可以不是邻接顶点，只要有路径连接即可，可以途经多个顶点。

・如果无向图中任意两个顶点都是连通的，那么这个图便称为连通图。如果无向图中包含两个顶点是不连通的，那么这个图便称为非连通图。

・无向图的极大连通子图称为该图的连通分量。

理论可以证明，对于一个连通图，其连通分量有且只有一个，那就是该连通图自身。而对于一个非连通图，则有可能存在多个连通分量。例如，图2-33中，图（a）为一个非连通图，因为其中顶点V2和顶点V3之间没有路径。这个非连通图中的连通分量包括两个，分别为图（b）和图（c）。

图2-33　非连通图的连通分量

10）强连通图和强连通分量

与无向图类似，在有向图中也有连通的概念，主要涉及如下内容：

・如果两个顶点之间有路径，也称这两个顶点是连通的。需要注意的是，有向图中边是有方向的。因此，有时从Vi到Vj是连通的，但从Vj到Vi却不一定连通。

・如果有向图中任意两个顶点都是连通的，则称该图为强连通图。如果有向图中包含两个顶点不是连通的，则称该图为非强连通图。

・有向图的极大强连通子图称为该图的强连通分量。

理论上可以证明，强连通图只有一个强连通分量，那就是该图自身。而对于一个非强连通图，则有可能存在多个强连通分量。例如，在图2-34中，图（a）为一个非强连通图，因为其中顶点V2和顶点V3之间没有路径。这个非强连通图中的强连通分量有两个，如图（b）和图（c）所示。

图2-34　非强连通图的强连通分量

11）权

在前面介绍图的时候，各个边并没有赋予任何含义。在实际的应用中往往需要将边表示成某种数值，这个数值便是该边的权（Weight）。无向图中加入权值，则称为无向带权图。有向图中加入权值，则称为有向带权图。典型的无向带权图和有向带权图，如图2-35所示。

权在实际应用中可以代表各种含义，例如，在交通图中表示道路的长度，在通信网络中表示基站之间的距离，在人际关系中代表亲密程度等。

图2-35　典型的无向带权图和有向带权图

12）网（Network）

网即边上带有权值的图的另一名称。网的概念与实际应用更为贴切。

2.8.3　准备数据

学习了前面的理论知识后，下面就开始图结构的程序设计。首先需要准备数据，即准备在图结构操作中需要用到的变量及数据结构等。由于图是一种复杂的数据结构，顶点之间存在多对多的关系，因此无法简单地将顶点映射到内存中。

在实际应用中，通常需要采用结构数组的形式来单独保存顶点信息，然后采用二维数组的形式保存顶点之间的关系。这种保存顶点之间关系的数组称为邻接矩阵（Adjacency Matrix）。

这样，对于一个包含n个顶点的图，可以使用如下语句来声明一个数组保存顶点信息，声明一个邻接矩阵保存边的权。

char[] Vertex=new char[MaxNum]；//保存顶点信息（序号或字母））

int[][] EdgeWeight=new int[MaxNum][MaxNum]；//保存边的权

对于数组Vertex，其中每一个数组元素保存顶点信息，可以是序号或者字母。而邻接矩阵EdgeVeight保存边的权或者连接关系。

在表示连接关系时，该二维数组中的元素EdgeVeight[i][j]=1表示（Vi，Vj）或<Vi，Vj>构成一条边，如果EdgeVeight[i][j]=0表示（Vi，Vj）或<Vi，Vj>不构成一条边。例如，对于图2-36所示的无向图，可以采用一维数组来保存顶点，保存的形式如图2-37所示。

图2-36　无向图

图2-37　顶点数组

示例代码如下：

对于邻接矩阵，可以按照如图2-38所示进行存储。对于有边的两个顶点，在对应的矩阵元素中填入1。例如，V1和V3之间存在一条边，因此EdgeVeight[1][3]中保存1，而V3和V1之间存在一条边，因此EdgeVeight[3][1]中保存1。因此可见，对于无向图，其邻接矩阵左下角和右上角是对称的。

对于有向图，如图2-39所示。保存顶点的一维数组形式不变，如图2-40所示。而对于邻接矩阵，仍然采用二维数组，其保存形式如图2-41所示。对于有边的两个顶点，在对应的矩阵元素中保存1。这里需要注意，边是有方向的。

图2-38　邻接矩阵

图2-39　有向图

图2-40　顶点数组

例如，顶点V2到顶点V3存在一条边，因此在EdgeVeight[2][3]中保存1，而顶点V3到顶点V2不存在边，因此在EdgeVeight[3][2]中保存0。

对于带有权值的图来说，邻接矩阵中可以保存相应的权值。也就是说，此时，有边的项保存对应的权值，而无边的项则保存一个特殊的符号Z。例如，对于图2-42所示的有向带权图，其对应的邻接矩阵，如图2-43所示。

图2-41　有向图的邻接矩阵

这里需要注意的是，在实际程序中为了保存带权值的图，往往定义一个最大值MAX，其大于所有边的权值之和，用MAX来替代特殊的符号Z保存在二维数组中。

图2-42　有向带权图

图2-43　有向带权图的邻接矩阵

学习了前面的理论知识后，可以在程序中准备相应的数据用于保存图结构。示例代码如下：

在上述代码中，定义了图的最大顶点数MaxNum和用于保存特殊符号Z的最大值MaxValue。邻接矩阵图结构为GraphMatrix，其中包括保存顶点信息的数组Vertex，图的类型GType、顶点的数量VertexNum、边的数量EdgeNum、保存边的权的二维数组EdgeWeight及遍历标志数组isTrav。

2.8.4　创建图

在使用图结构之前，首先要创建并初始化一个图。代码示例如下：

在上述代码中，输入参数GM为一个指向图结构的引用。程序中，由用户输入顶点信息和边的信息。对于边来说，需要输入起始顶点、结束顶点和权值，各项以空格分割。最后，判断是否为无向图，因为无向图还需将边的权值保存到对角位置。

2.8.5　清空图

清空图即将一个图结构变成一个空图，这里只需将矩阵中各个元素设置为MaxValue即可。清空图的示例代码如下：

在上述代码中，输入参数GM为一个指向图结构的引用。程序中，通过双重循环为矩阵中各个元素赋值MaxValue，表示这是一个空图。

2.8.6　显示图

显示图即显示图的邻接矩阵，用户可以通过邻接矩阵方便地了解图的顶点和边等结构信息。显示图的示例代码如下：

在上述代码中，输入参数GM为一个指向图结构的引用。在程序中，首先在第1行输出顶点信息。然后，逐个输出矩阵中的每个元素。这里，以Z表示无穷大MaxValue。

2.8.7　遍历图

遍历图即逐个访问图中所有的顶点。由于图的结构复杂，存在多对多的特点，因此，当顺着某一路径访问过某顶点后，可能还会顺着另一路径回到该顶点。同一顶点被多次访问浪费了大量时间，使得遍历的效率低。

为了避免这种情况，可在图结构中设置一个数组isTrav[n]，该数组各元素的初始值为0，当某个顶点被遍历访问过，则设置对应的数据元素值为1。在访问某个顶点i时，先判断数组isTrav[i]中的值，如果其值为1，则继续路径的下一个顶点；如果其值为0，则访问当前顶点（进行相应的处理），然后继续路径的下一个顶点。

常用的遍历图的方法有两种：广度优先遍历法和深度优先遍历法。下面以深度优先遍历法为例进行介绍。深度优先遍历法类似于树的先序遍历，具体执行过程如下：

（1）从数组isTrav中选择一个未被访问的顶点Vi，将其标记为1，表示已访问。

（2）从Vi的一个未被访问过的邻接点出发进行深度优先遍历。

（3）重复步骤（2），直至图中所有和Vi有路径相通的顶点都被访问过。

（4）重复步骤（1）至步骤（3）的操作，直到图中所有顶点都被访问过。

深度优先遍历法是一个递归过程，具体的程序代码示例如下：