数学建模社区-数学中国

标题: 二分覆盖 [打印本页]

作者: 韩冰 时间: 2004-10-4 05:25
标题: 二分覆盖
<

>二分图是一个无向图，它的n 个顶点可二分为集合A和集合B，且同一集合中的任意两个顶点在图中无边相连（即任何一条边都是一个顶点在集合A中，另一个在集合B中）。当且仅当B中的每个顶点至少与A中一个顶点相连时，A的一个子集A' 覆盖集合B（或简单地说，A' 是一个覆盖）。覆盖A' 的大小即为A' 中的顶点数目。当且仅当A' 是覆盖B的子集中最小的时，A' 为最小覆盖。
<

>例1-10 考察如图1 - 6所示的具有1 7个顶点的二分图，A={1, 2, 3, 16, 17}和B={4, 5, 6, 7, 8, 9,10, 11, 12, 13, 14, 15}，子集A' = { 1 , 1 6 , 1 7 }是B的最小覆盖。在二分图中寻找最小覆盖的问题为二分覆盖（ b i p a r t i t e - c o v e r）问题。在例1 2 - 3中说明了最小覆盖是很有用的，因为它能解决“在会议中使用最少的翻译人员进行翻译”这一类的问题。
<

>二分覆盖问题类似于集合覆盖（ s e t - c o v e r）问题。在集合覆盖问题中给出了k 个集合S= {S1 , S2 ,., Sk }，每个集合Si 中的元素均是全集U中的成员。当且仅当èi S'Si =U时，S的子集S' 覆盖U，S '中的集合数目即为覆盖的大小。当且仅当没有能覆盖U的更小的集合时，称S' 为最小覆盖。可以将集合覆盖问题转化为二分覆盖问题（反之亦然），即用A的顶点来表示S1 , ., Sk ，B中的顶点代表U中的元素。当且仅当S的相应集合中包含U中的对应元素时，在A与B的顶点之间存在一条边。
<

>例1 - 11 令S= {S1，. . .，S5 }, U= { 4，5，. . .，15}, S1 = { 4，6，7，8，9，1 3 }，S2 = { 4，5，6，8 }，S3 = { 8，1 0，1 2，1 4，1 5 }，S4 = { 5，6，8，1 2，1 4，1 5 }，S5 = { 4，9，1 0，11 }。S ' = {S1，S4，S5 }是一个大小为3的覆盖，没有更小的覆盖， S' 即为最小覆盖。这个集合覆盖问题可映射为图1-6的二分图，即用顶点1，2，3，1 6和1 7分别表示集合S1，S2，S3，S4 和S5，顶点j 表示集合中的元素j，4≤j≤1 5。
<

>集合覆盖问题为N P-复杂问题。由于集合覆盖与二分覆盖是同一类问题，二分覆盖问题也是N P-复杂问题。因此可能无法找到一个快速的算法来解决它，但是可以利用贪婪算法寻找一种快速启发式方法。一种可能是分步建立覆盖A' ，每一步选择A中的一个顶点加入覆盖。顶点的选择利用贪婪准则：从A中选取能覆盖B中还未被覆盖的元素数目最多的顶点。
<

>例1-12 考察图1 - 6所示的二分图，初始化A' = 且B中没有顶点被覆盖，顶点1和1 6均能覆盖B中的六个顶点，顶点3覆盖五个，顶点2和1 7分别覆盖四个。因此，在第一步往A' 中加入顶点1或1 6，若加入顶点1 6，则它覆盖的顶点为{ 5 , 6 , 8 , 1 2 , 1 4 , 1 5 }，未覆盖的顶点为{ 4 , 7 , 9 , 1 0 , 11 , 1 3 }。顶点1能覆盖其中四个顶点（ { 4 , 7 , 9 , 1 3 }），顶点2 覆盖一个( { 4 } )，顶点3覆盖一个（{ 1 0 }），顶点1 6覆盖零个，顶点1 7覆盖四个{ 4 , 9 , 1 0 , 11 }。下一步可选择1或1 7加入A' 。若选择顶点1，则顶点{ 1 0 , 11} 仍然未被覆盖，此时顶点1，2，1 6不覆盖其中任意一个，顶点3覆盖一个，顶点1 7覆盖两个，因此选择顶点1 7，至此所有顶点已被覆盖，得A' = { 1 6 , 1 , 1 7 }。
<

>图1 - 7给出了贪婪覆盖启发式方法的伪代码，可以证明： 1) 当且仅当初始的二分图没有覆盖时，算法找不到覆盖；2) 启发式方法可能找不到二分图的最小覆盖。
<

>1. 数据结构的选取及复杂性分析
<

>为实现图13 - 7的算法，需要选择A' 的描述方法及考虑如何记录A中节点所能覆盖的B中未覆盖节点的数目。由于对集合A' 仅使用加法运算，则可用一维整型数组C来描述A '，用m 来记录A' 中元素个数。将A' 中的成员记录在C[ 0 :m-1] 中。对于A中顶点i，令N e wi 为i 所能覆盖的B中未覆盖的顶点数目。逐步选择N e wi 值最大的顶点。由于一些原来未被覆盖的顶点现在被覆盖了，因此还要修改各N e wi 值。在这种更新中，检查B中最近一次被V覆盖的顶点，令j 为这样的一个顶点，则A中所有覆盖j 的顶点的N e wi 值均减1。
<

>例1-13 考察图1 - 6，初始时(N e w1 , N e w2 , N e w3 , N e w16 , N e w17 ) = ( 6 , 4 , 5 , 6 , 4 )。假设在例1 - 1 2中，第一步选择顶点1 6，为更新N e wi 的值检查B中所有最近被覆盖的顶点，这些顶点为5 , 6 , 8 , 1 2 , 1 4和1 5。当检查顶点5时，将顶点2和1 6的N e wi 值分别减1，因为顶点5不再是被顶点2和1 6覆盖的未覆盖节点；当检查顶点6时，顶点1 , 2 ,和1 6的相应值分别减1；同样，检查顶点8时，1，2，3和1 6的值分别减1；当检查完所有最近被覆盖的顶点，得到的N e wi 值为（4，1，0，4）。下一步选择顶点1，最新被覆盖的顶点为4，7，9和1 3；检查顶点4时，N e w1 , N e w2, 和N e w1 7 的值减1；检查顶点7时，N e w1 的值减1，因为顶点1是覆盖7的唯一顶点。
<

>为了实现顶点选取的过程，需要知道N e wi 的值及已被覆盖的顶点。可利用一个二维数组来达到这个目的，N e w是一个整型数组，New 即等于N e wi，且c o v为一个布尔数组。若顶点i未被覆盖则c o v [ i ]等于f a l s e，否则c o v [ i ]为t r u e。现将图1 - 7的伪代码进行细化得到图1 - 8。
3 A3 v5 n1 p9 {8 q! _* z/ a! _: ?<>m=0; //当前覆盖的大小
" K% u, g1 C3 Z' v$ q# ]3 F5 p<>对于A中的所有i，New=Degree2 X( \; a1 N- P. H5 k7 g _
<>对于B中的所有i，C o v [ i ] = f a l s e0 y9 K+ p" Q" }: K, {0 E
<>while (对于A中的某些i,New>0) {1 O6 u: j, |" w, d- ^0 H2 h
<>设v是具有最大的N e w [ i ]的顶点；
( z9 S& V( g- R9 _/ l<>C [ m + + ] = v ;
6 S( b9 d# t3 M: h0 Z! k<>for ( 所有邻接于v的顶点j) {4 y+ L! K0 @* D( z) n
<>if (!Cov[j]) {
' O; E ^5 }# z7 D: ^<>Cov[j]= true;' d% e- c5 V' y6 h4 b
<>对于所有邻接于j的顶点，使其N e w [ k ]减17 e& k( c2 H* u, a6 Z& J. O
<>} } }
* U3 l1 V, ^8 O6 v3 b4 i' O<>if (有些顶点未被覆盖) 失败+ |. Q5 L1 [: K( [0 K; k
<>else 找到一个覆盖
4 L! d0 t0 X1 r4 V# o1 e<>图1-8 图1-7的细化; z: X; y2 \5 Y
<>更新N e w的时间为O (e)，其中e 为二分图中边的数目。若使用邻接矩阵，则需花(n2 ) 的时间来寻找图中的边，若用邻接链表，则需(n+e) 的时间。实际更新时间根据描述方法的不同为O (n2 ) 或O (n+e)。逐步选择顶点所需时间为(S i z e O f A)，其中S i z e O f A=| A |。因为A的所有顶点都有可能被选择，因此所需步骤数为O ( S i z e O f A )，覆盖算法总的复杂性为O ( S i z e O f A 2+n2) = O ( n2)或O (S i z e Of A2+n + e)。
# R% q, k5 \$ r, t! u: [1 Q% d4 |<>2. 降低复杂性
; Q/ T. @' g W& ^$ q' C5 `' T2 z6 m<>通过使用有序数组N e wi、最大堆或最大选择树（max selection tree）可将每步选取顶点v的复杂性降为( 1 )。但利用有序数组，在每步的最后需对N e wi 值进行重新排序。若使用箱子排序，则这种排序所需时间为(S i z e O f B ) ( S i z e O fB =|B| ) （见3 . 8 . 1节箱子排序）。由于一般S i z e O f B比S i z e O f A大得多，因此有序数组并不总能提高性能。' T9 Q6 v. l( P6 I
<>如果利用最大堆，则每一步都需要重建堆来记录N e w值的变化，可以在每次N e w值减1时进行重建。这种减法操作可引起被减的N e w值最多在堆中向下移一层，因此这种重建对于每次N e w值减1需( 1 )的时间，总共的减操作数目为O (e)。因此在算法的所有步骤中，维持最大堆仅需O (e)的时间，因而利用最大堆时覆盖算法的总复杂性为O (n2 )或O (n+e)。
2 Q6 h8 Y$ w/ _/ T4 S! P<>若利用最大选择树，每次更新N e w值时需要重建选择树，所需时间为(log S i z e O f A)。重建的最好时机是在每步结束时，而不是在每次N e w值减1时，需要重建的次数为O (e)，因此总的重建时间为O (e log S i z e OfA)，这个时间比最大堆的重建时间长一些。然而，通过维持具有相同N e w值的顶点箱子，也可获得和利用最大堆时相同的时间限制。由于N e w的取值范围为0到S i z e O f B，需要S i z e O f B+ 1个箱子，箱子i 是一个双向链表，链接所有N e w值为i 的顶点。在某一步结束时，假如N e w [ 6 ]从1 2变到4，则需要将它从第1 2个箱子移到第4个箱子。利用模拟指针及一个节点数组n o d e（其中n o d e [ i ]代表顶点i，n o d e [ i ] . l e f t和n o d e [ i ] . r i g h t为双向链表指针），可将顶点6从第1 2个箱子移到第4个箱子，从第1 2个箱子中删除n o d e [ 0 ]并将其插入第4个箱子。利用这种箱子模式，可得覆盖启发式算法的复杂性为O (n2 )或O(n+e)。（取决于利用邻接矩阵还是线性表来描述图）。% v: ~7 L! [' i5 W6 \4 Q1 v
3. 双向链接箱子的实现
( M# j4 Y4 u& O4 a为了实现上述双向链接箱子，图1 - 9定义了类U n d i r e c t e d的私有成员。N o d e Ty p e是一个具有私有整型成员l e f t和r i g h t的类，它的数据类型是双向链表节点，程序1 3 - 3给出了U n d i r e c t e d的私有成员的代码。$ H0 z3 v" ]/ X8 G* H6 p3 f3 W

4 z L. J) n J
7 I5 A1 H$ ^7 U* ~6 _void CreateBins (int b, int n)( s5 n* e# E# u% F
创建b个空箱子和n个节点
9 M2 f1 l4 O/ G# h( P# M. q3 ^void DestroyBins() { delete [] node;2 ~% P; i- A( e! D* e1 `
delete [] bin;}. U# b* P+ o, X+ @- z1 U, v1 \ a
void InsertBins(int b, int v) q7 [6 A5 X8 s+ P0 R9 ]" M
在箱子b中添加顶点v7 o* ~8 `. L( t# J
void MoveBins(int bMax, int ToBin, int v)
6 Q0 N+ J; {) t( c3 X4 ^4 f从当前箱子中移动顶点v到箱子To B i n
* H* ?9 K; b& x% C; Y% p$ n2 Wint *bin;1 b! o& w/ s$ f9 v# g: ]" h; y1 V
b i n [ i ]指向代表该箱子的双向链表的首节点
$ ?# J# K) k! ?9 _$ cN o d e Type *node;
) e8 e" R! f5 G" B9 q2 o# m, Cn o d e [ i ]代表存储顶点i的节点# w6 ?- y6 S3 K( A9 ? z; a7 R4 O
图1-9 实现双向链接箱子所需的U n d i r e c t e d私有成员' x6 x- o- P' t; y

0 S% c' P* M5 B. B5 I+ z程序13-3 箱子函数的定义
$ p$ v/ Q, e0 \8 f! W3 Q' bvoid Undirected::CreateBins(int b, int n)+ o$ S, d. c% _1 H( P9 b
{// 创建b个空箱子和n个节点
# J0 h8 m0 u# }$ M" znode = new NodeType [n+1];# N5 k9 u: F* k
bin = new int [b+1];
* h: \5 |7 |0 u' L' q// 将箱子置空6 @# N& v- ^$ Q: p2 d6 g" w) I+ Y
for (int i = 1; i <= b; i++)( D. v- V/ w/ ?: W1 F
bin = 0;* @% O" I0 ^. C! | W& v
}
 P6 ^) ~; G8 M7 l* O: a, xvoid Undirected::InsertBins(int b, int v)
# \2 I7 {7 `3 Y/ C{// 若b不为０，则将v 插入箱子b
* O4 u0 b9 ?# s# C/ k% \8 }if (!b) return; // b为0，不插入7 w7 v8 ?) {# i x0 N
node[v].left = b; // 添加在左端4 K: J1 O2 X8 B7 ]# x, g) p
if (bin) node[bin].left = v;
/ D7 M" b. ~! Y$ H, }node[v].right = bin;
5 ]3 S$ d( F8 j* P, X2 Bbin = v;) z1 C/ ?2 O. L4 d0 t0 f
}
$ T" b; T8 W* L. O% M! ~/ @void Undirected::MoveBins(int bMax, int ToBin, int v)
) B: S* a, z4 h: S) Y5 I! u1 [/ U{// 将顶点v 从其当前所在箱子移动到To B i n .& H9 |6 }! M) e- K
// v的左、右节点
. [! j9 f8 Y0 n, g% yint l = node[v].left;
9 Y, K1 |% G) U; oint r = node[v].right;
# k* M$ b/ _# b// 从当前箱子中删除
- ]7 M; V h# g; a& O' Yif (r) node[r].left = node[v].left;
# q$ q% t7 [: t8 ^if (l > bMax || bin[l] != v) // 不是最左节点: y; j, s5 o7 x( |/ P4 ^
node[l].right = r;, T' H$ b) j& f) J6 O: @7 o
else bin[l] = r; // 箱子l的最左边, G0 S5 s1 H/ V( `+ w1 j: r
// 添加到箱子To B i n, g1 A! f, G: r0 I; l1 Y$ d! n$ D
I n s e r t B i n s ( ToBin, v);
9 ?) l: x" n5 C; r3 m- o- \6 n* d}/ l* l7 |4 B* F- c& @! ~
函数C r e a t e B i n s动态分配两个数组： n o d e和b i n，n o d e [i ]表示顶点i, bin[i ]指向其N e w值为i的双向链表的顶点, f o r循环将所有双向链表置为空。如果b≠0，函数InsertBins 将顶点v 插入箱子b 中。因为b 是顶点v 的New 值，b = 0意味着顶点v 不能覆盖B中当前还未被覆盖的任何顶点，所以，在建立覆盖时这个箱子没有用处，故可以将其舍去。当b≠0时，顶点n 加入New 值为b 的双向链表箱子的最前面，这种加入方式需要将node[v] 加入bin 中第一个节点的左边。由于表的最左节点应指向它所属的箱子，因此将它的node[v].left 置为b。若箱子不空，则当前第一个节点的left 指针被置为指向新节点。node[v] 的右指针被置为b i n [ b ]，其值可能为0或指向上一个首节点的指针。最后， b i n [ b ]被更新为指向表中新的第一个节点。MoveBins 将顶点v 从它在双向链表中的当前位置移到New 值为ToBin 的位置上。其中存在bMa x，使得对所有的箱子b i n[ j ]都有：如j>bMa x，则b i n [ j ]为空。代码首先确定n o d e [ v ]在当前双向链表中的左右节点，接着从双链表中取出n o d e [ v ]，并利用I n s e r t B i n s函数将其重新插入到b i n [ To B i n ]中。3 g( j7 I9 E0 t5 Z# P
4. Undirected::BipartiteCover的实现
6 g/ z$ j# E; B% H+ N函数的输入参数L用于分配图中的顶点（分配到集合A或B）。L [i ] = 1表示顶点i在集合A中，L[ i ] = 2则表示顶点在B中。函数有两个输出参数： C和m，m为所建立的覆盖的大小， C [ 0 , m - 1 ]是A中形成覆盖的顶点。若二分图没有覆盖，函数返回f a l s e；否则返回t r u e。完整的代码见程序1 3 - 4。: x. M9 g; v4 y* O1 k
程序13-4 构造贪婪覆盖
" r2 v2 ^( j0 X4 R0 g5 H% T$ Y( d) Lbool Undirected::BipartiteCover(int L[], int C[], int& m)0 K/ U- L, M4 N: A; n6 T. @$ x
{// 寻找一个二分图覆盖( l; m7 h [, _
// L 是输入顶点的标号, L = 1 当且仅当i 在Ａ中5 ~$ ~# s: A& Z" s+ R$ @- `; G5 R
// C 是一个记录覆盖的输出数组# {9 F9 q' k: N# C
// 如果图中不存在覆盖，则返回f a l s e
2 T7 N' D% Q" s% D% y; u% C// 如果图中有一个覆盖，则返回t r u e ;
) `' z- V8 H8 P& s2 b0 N: U3 ^- O// 在m中返回覆盖的大小; 在C [ 0 : m - 1 ]中返回覆盖
7 ^7 j: m, H) J7 O- e, e$ h& ?int n = Ve r t i c e s ( ) ;
5 y9 Y3 x+ T/ m+ p) x3 p// 插件结构% {0 s5 R- g5 j
int SizeOfA = 0;0 Q* e( ?+ D/ P4 v
for (int i = 1; i <= n; i++) // 确定集合A的大小
) }* d* F( W4 i" Oif (L == 1) SizeOfA++;
7 \: N v9 t, s4 R( Y( [int SizeOfB = n - SizeOfA;
- i) h7 M$ j' b# nCreateBins(SizeOfB, n);, b7 p% R- L* U8 w! G0 P8 M0 X' B
int *New = new int [n+1]; / /顶点i覆盖了Ｂ中N e w [ i ]个未被覆盖的顶点
& g( z1 m& ^1 H' {4 ^bool *Change = new bool [n+1]; // Change为t r u e当且仅当New 已改变# s+ s, I0 ^7 I4 x% Q I1 g6 ]& Y
bool *Cov = new bool [n+1]; // Cov 为true 当且仅当顶点i 被覆盖3 v/ Q H& f# g% S- v
I n i t i a l i z e P o s ( ) ;
( t4 L& G! N: }LinkedStack<INT> S;5 k6 i# \; u$ S3 Y$ x
// 初始化: }6 @0 T6 D- ?$ {8 ~' f! S
for (i = 1; i <= n; i++) {
( t% }9 Q. |& E* P- iCov = Change = false;! _6 y5 U2 [+ a- [
if (L == 1) {// i 在A中3 q( y4 ]+ w8 G- h0 [, h. P3 \4 J
New = Degree(i); // i 覆盖了这么多
2 ^" J6 i- R$ X( [6 k" ^* c yInsertBins(New, i);}} G D! ?/ E7 M; R6 M1 B
// 构造覆盖
8 `$ X: |- _& ]) C1 r* vint covered = 0, // 被覆盖的顶点 V! e( i2 \0 y! J: U7 m6 o* K- u
MaxBin = SizeOfB; // 可能非空的最大箱子
' Z: h# U5 X9 m! ?9 v$ k9 F+ ^7 Qm = 0; // C的游标
# Y$ c2 J+ H& Gwhile (MaxBin > 0) { // 搜索所有箱子
/ J9 x1 ^* B5 r R- S% n// 选择一个顶点: q6 ~6 {# X( Z3 i; e( g
if (bin[MaxBin]) { // 箱子不空* z8 y0 k; j+ I( {
int v = bin[MaxBin]; // 第一个顶点. z6 y2 `2 T. p8 r+ {8 x5 n* |
C[m++] = v; // 把v 加入覆盖
6 o0 B( d T. E- `' C// 标记新覆盖的顶点
- I, m. p9 G; o$ cint j = Begin(v), k;) o+ T. a; P: @ y
while (j) {' C7 F+ [# _+ W8 j- a# |$ e) d
if (!Cov[j]) {// j尚未被覆盖
0 P U5 r2 n7 F$ D+ TCov[j] = true;
9 s/ l% v. r6 t E- z# V' lc o v e r e d + + ;
6 @3 ~: r+ |5 {! y// 修改N e w0 C3 M/ x. K+ r9 q7 m' l; o* t! h
k = Begin(j);4 s+ f |% h5 H) A# D' b/ X- S! F
while (k) {& Q" B. t# R* A: f
New[k]--; // j 不计入在内; }, @6 q8 A% x2 A7 ?3 D( c, X
if (!Change[k]) {
( ~* P# C- L6 r4 h& ]S.Add(k); // 仅入栈一次
( p% L# f9 S% p) r5 ? yChange[k] = true;}" M2 q1 m: S8 V) {4 P! z
k = NextVe r t e x ( j ) ; }
: n7 ^5 ]. x* C6 D}
, l6 P Z$ F- E( ?7 Pj = NextVe r t e x ( v ) ; }, k9 q) y q) J$ i; ?- W" S
// 更新箱子! R& ?3 F! N3 t- r
while (!S.IsEmpty()) {
0 e8 K) E' w! F) ES . D e l e t e ( k ) ;
- b! o1 g$ l) |% l! @4 MChange[k] = false;% H: n6 G' N+ T4 e9 U! f
MoveBins(SizeOfB, New[k], k);}$ o; `, V6 D& B& m, ^- `
}9 e8 H5 k( L! k7 U7 z6 j* D
else MaxBin--;2 F, F+ }, I, l( H# C, H: e
}* x$ L8 N* U/ e2 s3 V" Y: W" n- H
D e a c t i v a t e P o s ( ) ;
4 ^# a- |0 n7 D7 e& H7 X2 T- oD e s t r o y B i n s ( ) ;
( o O' P( n, V& Z+ n# sdelete [] New;. {: O9 i) d9 }- i( ]0 _8 k5 ^
delete [] Change;. K2 E9 m/ _, z2 d
delete [] Cov;' O. j: q. p" O/ ]& _
return (covered == SizeOfB);
6 F4 X) F% }$ A8 C0 H* f8 Z}
7 R4 c) w3 F, r' }; n程序1 3 - 4首先计算出集合A和B的大小、初始化必要的双向链表结构、创建三个数组、初始化图遍历器、并创建一个栈。然后将数组C o v和C h a n g e初始化为f a l s e，并将A中的顶点根据它们覆盖B中顶点的数目插入到相应的双向链表中。
; D+ b% k: A5 l1 c: }为了构造覆盖，首先按SizeOfB 递减至1的顺序检查双向链表。当发现一个非空的表时，就将其第一个顶点v 加入到覆盖中，这种策略即为选择具有最大Ne o v [ j ]置为t r u e，表示顶点j 现在已被覆盖，同时将已被覆盖的B中的顶点数目加1。由于j 是最近被覆w 值的顶点。将所选择的顶点加入覆盖数组C并检查B中所有与它邻接的顶点。若顶点j 与v 邻接且还未被覆盖，则将C盖的，所有A中与j 邻接的顶点的New 值减1。下一个while 循环降低这些New 值并将New 值被降低的顶点保存在一个栈中。当所有与顶点v邻接的顶点的Cov 值更新完毕后，N e w值反映了A中每个顶点所能覆盖的新的顶点数，然而A中的顶点由于New 值被更新，处于错误的双向链表中，下一个while 循环则将这些顶点移到正确的表中。
作者: mengfanqi 时间: 2005-8-30 13:42
<>good!
作者: daomeidan1234 时间: 2006-3-8 12:43
very good

欢迎光临数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5