第八讲:图(下)
8.1 最小生成树问题
8.1.1 最小生成树(Minimum Spanning Tree)
如图1所示。
图1
它是一棵树:无回路;|V|个顶点一定有|V|-1条边;
它是生成树:包含全部顶点;|V|-1条边都在图里。在图1中,第2/3/4个图都是图1的生成树,可以看出,生成树中任加一条边都一定构成回路。
最小:边的权重和最小。
显然可以得出,最小生成树存在<->图连通。
8.1.2 贪心算法
贪:每一步都要最好的。好:权重最小的边。
需要约束:只能用图里有的边;只能正好用掉|V|-1条边;不能有回路。
8.1.3 Prim算法(密集图)—让一棵小树长大
如图2所示,我们选择v1作为源节点,选择权重最小的(为1),到v4;然后我们看这个图,权重最小的为2有两个边,分别到v2和v3,我们先选择连到v2,再用v4连接到v3;为了不构成回路,我们需要选择权重为4的由v4到v7的边;再选择权重为1的v6,再选择权重为6的v5。
图2
其伪码描述如下,其中dist[V]=E(s,v)或正无穷,parent[s]=-1:
void Prim()
{
MST={s};
while(1){
V=未收录顶点中dist最小者;
if(V不存在)
break;
将V收录进MST,dist[V]=0;
for(V的每一个邻接点W)
if(dist[W]!=0)/*即这个点未被收入*/
if(E[V,W]<dist[W]){
dist[W]=E[V,W];
parent[W]=v;
}
}
if(MST中收的顶点不到|V|个)
Error("生成树不存在");
}
完整代码:
/* 邻接矩阵存储 - Prim最小生成树算法 */
Vertex FindMinDist( MGraph Graph, WeightType dist[] )
{ /* 返回未被收录顶点中dist最小者 */
Vertex MinV, V;
WeightType MinDist = INFINITY;
for (V=0; V<Graph->Nv; V++) {
if ( dist[V]!=0 && dist[V]<MinDist) {
/* 若V未被收录,且dist[V]更小 */
MinDist = dist[V]; /* 更新最小距离 */
MinV = V; /* 更新对应顶点 */
}
}
if (MinDist < INFINITY) /* 若找到最小dist */
return MinV; /* 返回对应的顶点下标 */
else return ERROR; /* 若这样的顶点不存在,返回-1作为标记 */
}
int Prim( MGraph Graph, LGraph MST )
{ /* 将最小生成树保存为邻接表存储的图MST,返回最小权重和 */
WeightType dist[MaxVertexNum], TotalWeight;
Vertex parent[MaxVertexNum], V, W;
int VCount;
Edge E;
/* 初始化。默认初始点下标是0 */
for (V=0; V<Graph->Nv; V++) {
/* 这里假设若V到W没有直接的边,则Graph->G[V][W]定义为INFINITY */
dist[V] = Graph->G[0][V];
parent[V] = 0; /* 暂且定义所有顶点的父结点都是初始点0 */
}
TotalWeight = 0; /* 初始化权重和 */
VCount = 0; /* 初始化收录的顶点数 */
/* 创建包含所有顶点但没有边的图。注意用邻接表版本 */
MST = CreateGraph(Graph->Nv);
E = (Edge)malloc( sizeof(struct ENode) ); /* 建立空的边结点 */
/* 将初始点0收录进MST */
dist[0] = 0;
VCount ++;
parent[0] = -1; /* 当前树根是0 */
while (1) {
V = FindMinDist( Graph, dist );
/* V = 未被收录顶点中dist最小者 */
if ( V==ERROR ) /* 若这样的V不存在 */
break; /* 算法结束 */
/* 将V及相应的边<parent[V], V>收录进MST */
E->V1 = parent[V];
E->V2 = V;
E->Weight = dist[V];
InsertEdge( MST, E );
TotalWeight += dist[V];
dist[V] = 0;
VCount++;
for( W=0; W<Graph->Nv; W++ ) /* 对图中的每个顶点W */
if ( dist[W]!=0 && Graph->G[V][W]<INFINITY ) {
/* 若W是V的邻接点并且未被收录 */
if ( Graph->G[V][W] < dist[W] ) {
/* 若收录V使得dist[W]变小 */
dist[W] = Graph->G[V][W]; /* 更新dist[W] */
parent[W] = V; /* 更新树 */
}
}
} /* while结束*/
if ( VCount < Graph->Nv ) /* MST中收的顶点不到|V|个 */
TotalWeight = ERROR;
return TotalWeight; /* 算法执行完毕,返回最小权重和或错误标记 */
}
8.1.4 Kruskal算法(稀疏图)—将森林合并成树
寻找权重最短的边,初始的情况下认为每一个顶点都是一棵树,通过不断把边收进来,就把两棵树并成了一棵树,最后把所有节点并成一棵树。
伪码如下:
void Kruskal(Graph G)
{
MST = {};
while(MST中不到|V-1|条边&&E中还有边){
从E中去一条权重最小的边E)(V,W);/*最小堆*/
将E(V,W)从E中删除;
if(E(V,W)不在MST中构成回路)/*并查集*/
将E(V,W)加入MST;
else
彻底无视E(V,W);
}
if(MST中不到|V|-1条边)
ERROR("生成树不存在");
}
复杂度为T=O(|E|log|E|)
完整代码:
/* 邻接表存储 - Kruskal最小生成树算法 */
/*-------------------- 顶点并查集定义 --------------------*/
typedef Vertex ElementType; /* 默认元素可以用非负整数表示 */
typedef Vertex SetName; /* 默认用根结点的下标作为集合名称 */
typedef ElementType SetType[MaxVertexNum]; /* 假设集合元素下标从0开始 */
void InitializeVSet( SetType S, int N )
{ /* 初始化并查集 */
ElementType X;
for ( X=0; X<N; X++ ) S[X] = -1;
}
void Union( SetType S, SetName Root1, SetName Root2 )
{ /* 这里默认Root1和Root2是不同集合的根结点 */
/* 保证小集合并入大集合 */
if ( S[Root2] < S[Root1] ) { /* 如果集合2比较大 */
S[Root2] += S[Root1]; /* 集合1并入集合2 */
S[Root1] = Root2;
}
else { /* 如果集合1比较大 */
S[Root1] += S[Root2]; /* 集合2并入集合1 */
S[Root2] = Root1;
}
}
SetName Find( SetType S, ElementType X )
{ /* 默认集合元素全部初始化为-1 */
if ( S[X] < 0 ) /* 找到集合的根 */
return X;
else
return S[X] = Find( S, S[X] ); /* 路径压缩 */
}
bool CheckCycle( SetType VSet, Vertex V1, Vertex V2 )
{ /* 检查连接V1和V2的边是否在现有的最小生成树子集中构成回路 */
Vertex Root1, Root2;
Root1 = Find( VSet, V1 ); /* 得到V1所属的连通集名称 */
Root2 = Find( VSet, V2 ); /* 得到V2所属的连通集名称 */
if( Root1==Root2 ) /* 若V1和V2已经连通,则该边不能要 */
return false;
else { /* 否则该边可以被收集,同时将V1和V2并入同一连通集 */
Union( VSet, Root1, Root2 );
return true;
}
}
/*-------------------- 并查集定义结束 --------------------*/
/*-------------------- 边的最小堆定义 --------------------*/
void PercDown( Edge ESet, int p, int N )
{ /* 改编代码4.24的PercDown( MaxHeap H, int p ) */
/* 将N个元素的边数组中以ESet[p]为根的子堆调整为关于Weight的最小堆 */
int Parent, Child;
struct ENode X;
X = ESet[p]; /* 取出根结点存放的值 */
for( Parent=p; (Parent*2+1)<N; Parent=Child ) {
Child = Parent * 2 + 1;
if( (Child!=N-1) && (ESet[Child].Weight>ESet[Child+1].Weight) )
Child++; /* Child指向左右子结点的较小者 */
if( X.Weight <= ESet[Child].Weight ) break; /* 找到了合适位置 */
else /* 下滤X */
ESet[Parent] = ESet[Child];
}
ESet[Parent] = X;
}
void InitializeESet( LGraph Graph, Edge ESet )
{ /* 将图的边存入数组ESet,并且初始化为最小堆 */
Vertex V;
PtrToAdjVNode W;
int ECount;
/* 将图的边存入数组ESet */
ECount = 0;
for ( V=0; V<Graph->Nv; V++ )
for ( W=Graph->G[V].FirstEdge; W; W=W->Next )
if ( V < W->AdjV ) { /* 避免重复录入无向图的边,只收V1<V2的边 */
ESet[ECount].V1 = V;
ESet[ECount].V2 = W->AdjV;
ESet[ECount++].Weight = W->Weight;
}
/* 初始化为最小堆 */
for ( ECount=Graph->Ne/2; ECount>=0; ECount-- )
PercDown( ESet, ECount, Graph->Ne );
}
int GetEdge( Edge ESet, int CurrentSize )
{ /* 给定当前堆的大小CurrentSize,将当前最小边位置弹出并调整堆 */
/* 将最小边与当前堆的最后一个位置的边交换 */
Swap( &ESet[0], &ESet[CurrentSize-1]);
/* 将剩下的边继续调整成最小堆 */
PercDown( ESet, 0, CurrentSize-1 );
return CurrentSize-1; /* 返回最小边所在位置 */
}
/*-------------------- 最小堆定义结束 --------------------*/
int Kruskal( LGraph Graph, LGraph MST )
{ /* 将最小生成树保存为邻接表存储的图MST,返回最小权重和 */
WeightType TotalWeight;
int ECount, NextEdge;
SetType VSet; /* 顶点数组 */
Edge ESet; /* 边数组 */
InitializeVSet( VSet, Graph->Nv ); /* 初始化顶点并查集 */
ESet = (Edge)malloc( sizeof(struct ENode)*Graph->Ne );
InitializeESet( Graph, ESet ); /* 初始化边的最小堆 */
/* 创建包含所有顶点但没有边的图。注意用邻接表版本 */
MST = CreateGraph(Graph->Nv);
TotalWeight = 0; /* 初始化权重和 */
ECount = 0; /* 初始化收录的边数 */
NextEdge = Graph->Ne; /* 原始边集的规模 */
while ( ECount < Graph->Nv-1 ) { /* 当收集的边不足以构成树时 */
NextEdge = GetEdge( ESet, NextEdge ); /* 从边集中得到最小边的位置 */
if (NextEdge < 0) /* 边集已空 */
break;
/* 如果该边的加入不构成回路,即两端结点不属于同一连通集 */
if ( CheckCycle( VSet, ESet[NextEdge].V1, ESet[NextEdge].V2 )==true ) {
/* 将该边插入MST */
InsertEdge( MST, ESet+NextEdge );
TotalWeight += ESet[NextEdge].Weight; /* 累计权重 */
ECount++; /* 生成树中边数加1 */
}
}
if ( ECount < Graph->Nv-1 )
TotalWeight = -1; /* 设置错误标记,表示生成树不存在 */
return TotalWeight;
}
8.2 拓扑排序
8.2.1 拓扑排序
AOV(Activity On Vertex)网络
如图3所示,是指所有的真实活动是表现在顶点上的,顶点与顶点之间的有向边表现了顶点间的先后顺序。
图3
所谓拓扑序是指:如果图中从V到W有一条有向路径,则V一定排在W之前,满足此条件的顶点序列称为一个拓扑序。获得一个拓扑序的过程就是拓扑排序。
AOV网络如果有合理(所谓不合理是指,网络形成了一个环,那就代表着V必须在V开始之前结束,自然不合理)的拓扑序,则必定是有向无环图(Directed Acyclic Graph, DAG)。
所谓拓扑排序,就是每一次输出没有前序顶点的顶点。
伪码描述如下:
void TopSort()
{
for(cnt=0;cnt<|V|;cnt++){
v = 为输出的入度为0的顶点;/*简单粗暴法此步O(|V|),总为O(|V|2)*/
/*聪明的算法如下文所述*/
if(这样的V不存在_{
Error("图中有回路");
break;
}
输出V,或者记录V的输出序号;
for(V的每个邻接点W)
Indegree[W]--;
}
}
聪明的算法:随时将入度变为0的顶点放到一个容器(数组、堆栈、队列等都行)中,下一次直接从这里面直接拿数据就可以了。利用队列的新的伪码描述:
void TopSort()
{
for(图中每个顶点V){
if(Indegree[V]==0)
Enqueue(V,Q);
}
while(!IsEmpty(Q){
V=Dequeue(Q);
输出V,或者记录V的输出序号;cnt++;
for(V的每个邻接点W)
{
if(--Indegree[W]==0)
Enqueue(W,Q);
}
}
if(cnt!=|V|)
Error("图中有回路");
}
时间复杂度T=O(|V|+|E|)
完整代码:
/* 邻接表存储 - 拓扑排序算法 */
bool TopSort( LGraph Graph, Vertex TopOrder[] )
{ /* 对Graph进行拓扑排序, TopOrder[]顺序存储排序后的顶点下标 */
int Indegree[MaxVertexNum], cnt;
Vertex V;
PtrToAdjVNode W;
Queue Q = CreateQueue( Graph->Nv );
/* 初始化Indegree[] */
for (V=0; V<Graph->Nv; V++)
Indegree[V] = 0;
/* 遍历图,得到Indegree[] */
for (V=0; V<Graph->Nv; V++)
for (W=Graph->G[V].FirstEdge; W; W=W->Next)
Indegree[W->AdjV]++; /* 对有向边<V, W->AdjV>累计终点的入度 */
/* 将所有入度为0的顶点入列 */
for (V=0; V<Graph->Nv; V++)
if ( Indegree[V]==0 )
AddQ(Q, V);
/* 下面进入拓扑排序 */
cnt = 0;
while( !IsEmpty(Q) ){
V = DeleteQ(Q); /* 弹出一个入度为0的顶点 */
TopOrder[cnt++] = V; /* 将之存为结果序列的下一个元素 */
/* 对V的每个邻接点W->AdjV */
for ( W=Graph->G[V].FirstEdge; W; W=W->Next )
if ( --Indegree[W->AdjV] == 0 )/* 若删除V使得W->AdjV入度为0 */
AddQ(Q, W->AdjV); /* 则该顶点入列 */
} /* while结束*/
if ( cnt != Graph->Nv )
return false; /* 说明图中有回路, 返回不成功标志 */
else
return true;
}
8.2.2 关键路径
AOE(Activity On Edge)网络一般用于安排项目的工序。与AOV不同,AOE的活动表示在边上,而节点代表活动到此结束。一般情况下,AOE网络的图示为以下结构:
图4
如图5所示,图中虚线,且权重为0表示的是,要继续执行9/7权重那里,4/5这里必须都得走到了。
图5
问题1:整个工期有多长?
Earliest[0]=0;
Earliest[j]=max(<i,j>∈E){Earliest[i]+C<i,j>}
故Earliest[8]=18
问题2:哪几个组有机动时间(保证工期最长18天)?
方法是设置最后一个最晚完成时间为18天,然后往前推。
注意:虽然7倒推回去5只需要在第10天完工就可以,但是考虑到4必须在第7天完工,而6必须在第16天完工,又由于4、5同时完工才能往下走,所以5的最晚完成时间也必须和4同样,为第7天。
Latest[8]=18;
Latest[i]=(min<i,j>∈E){Latest[j]-C<i,j>}
所谓机动时间就是哪些组可以不用急着赶工
机动时间D<i,j>=Latest[j]-Earliest[i]-C<i,j>
所谓关键路径就是整个流程中最需要关注的地方,哪些步骤是一点也不能耽误的,只要它耽误了,整个流程都要耽误,所以它是绝对不允许延误的活动组成的路径。


文章评论