9、概率方法

概率空间

定义:概率空间

(Ω,P)Ω 为有限集, P:2Ω[0,1],测度 P 满足

  • P()=0
  • P(Ω)=1
  • P(AB)=P(A)+P(B)

Ω 的每个子集称为事件:P(A)=ωAP({ω})

定义:随机变量

函数 X: ΩR 称为一个随机变量。

定义:随机变量的期望

E[x]:=ωΩP({ω})X(ω).

期望具有线性性:

定理:期望的线性性

X,YΩ 上随机变量,则

E[X+Y]=E[X]+E[Y].

在组合学中,概率方法常见的用法是:

技术:概率方法

  • 假设我们需要找到一些组合对象,满足某些属性——称为“好属性”。考虑候选项的大集族并从中随机取出,称其为一个随机对象。若取出“好”对象的概率是正的,则必存在好对象。
  • 为了计算“好”对象的概率,我们常计算“坏”对象并论证其严格小于1。

并集的界

定理

n,s 满足 (ns)21(s2)<1,则 R(s,s)>n

证明: 只需找一个 Kn 的2-染色,其中无 Ks 团。

Φ 是全体 Kn 的 2-染色线成的集合。任取 cΦ。则 c 是一个随机 2-染色。注意各边被染为某色概率为 12,且各边独立。

令事件 B:该2-染色不包含单色 Ks。希望 P(B)>0。为此,考虑补事件 A=ΦB 及其概率 P(A)

对任意子集 S([n]s),假设其 ASS 构成一个单色 Ks 的概率,则 P(AS)=21(s2)。另一方面, A=S([n]s)AS,则

P(A)=P(S([n]s)AS)S([n]s)P(AS)=(ns)21(s2)<1.

这就说明了 P(B)>0

推论

R(s,s)se22s2.

证明:n=这一坨。回忆 (ns)<nss!s!>e(se)s,我们有

(ns)21(s2)<nse(s/e)s21(s2)=1.

因此 R(s,s)>n=se22s2(e2)1/s=se22s2.

定义:随机图

随机图 G(n,p)p(0,1)为:V=[n],每条边 e(V2) 独立地以概率 p 出现。

上面定理的证明中,我们事实上考虑了 G(n,1/2)

对性质 A,我们考察 G(n,1/2) 具有性质 A 的概率。事实上我们有

P(A)=P(G(n,1/2) 具有性质 A)=满足性质 A的图数2(n2).
定义:几乎一定

G(n,1/2) 几乎一定满足性质 A,若 limnP(A)=1
称几乎一定不满足,若 lim=0

定理:随机图几乎不是二分图

G(n,1/2) 几乎一定不是二分图。

证明:A 为事件: G(n,1/2) 不是二分图。对任意 U[n],令 AU 为事件: G 的所有边都在 U[n]U 之间。则我们有 A=U[n]AU。因此

P(AU)=2|U|(n|U|)2(n2)2n242(n2)=2n24+n2.

因此

P(A)=P(U[n]AU)U[n]P(AU)2n2n24+n20.

证毕。

练习

考虑[n] 的全体不交 k元子集对 (A,B) 构成的集族.称一个集合 Y 分离 (A,B),若 AYBY=. 证明存在 l=2k4klnn 个集合,使得每个对 (A,B) 均由其中之一分离.

证明:[n] 中选 l 次子集,每一次都是等可能的.由此我们选出一个集族 F,其中至多有 l 个子集.对每个不交 k元子集对 (A,B),令 XAB 为事件“不存在 F 中的成员分离 (A,B)”.由于分离 (A,B) 的子集合数为 2n2k 个,我们有

P(XAB)=(12n2k2n)l=(122k)l<e22kl=n2k.

总共有 (nk)(nkk) 个这样的子集对 (A,B).由于

(nk)(nkk)nk(nk)kn2k,

因此至少一个子集合对不被分离的概率为

P(A,BXAB)A,BP(XAB)<n2kn2k=1.

因此,存在这样的情况:每个对 (A,B) 均被分离.

可染色族

定义: k

FΩ 的子集族。称 F 是一个 k族,若其中子集均为 k元的。


2-族是一个图。

定义:可2-染色族

F 可2-染色,若存在函数 f: Ω{蓝,红} 使得每个子集 AF 均非单色。即:每个 A 都至少有一个蓝元素和一个红元素。

定义:

对任意 kZ+,令 m(k) 为使 kF 不可2-染色的最小数。

因此,我们有 m(k)t 当有仅当存在一个 kF ,其有 t 个子集且不可 2-染色。反过来, m(k)>t 等价于任一个由 t 个子集构成的 k族均可2-染色。


m(2)=3。。例: K3

定理/练习

m(k)>2k11.

也就是说, 任一包含 2k11 个子集的 k族可被2染色。

证明: 给定一个 kF,包含 2k11 个子集。只需找一个染色 f 使得 F 中的任一子集都有红与蓝顶点。称这样的染色是一个好染色。

考虑随机函数 φ:Ω{红,蓝}。令 Sφ 好这一事件。令 T=Sc,则必存在一个子集AF,其在 φ 下单色。对任意 AF,令 TA 为事件: Aφ 下单色。则

T=AFTA.

注意 P(TA)=212k=21k,故

P(T)=P(AFTA)AFP(TA)=|F|21k<1.

因此 P(S)=1P(T)>0,故存在好染色。

练习

证明若存在 p[0,1] 使得

(nk)p(k2)+(nt)(1p)(t2)<1,

就有 R(k,t)>n.以此证明存在 C>0 使 R(4,t)C(tlnt)3/2

证明: 考虑 Kn 的一个随机2-染色,染红概率为 p.对任意 k 顶点集合 R,令 AR 为事件“Kn[R] 是红色”.同样定义 BRt 顶点集合 R 中,Kn[R] 为蓝色的事件.则由于有 (k2) 条边,得

P(AR)=(nk)p(k2),P(Bt)=(nt)(1p)(k2).

于是 P(AR)+P(Bt)<1,故存在一种染色,使得既无红 Kk 又无蓝 Kt,故 R(k,t)>n

下面,对 k=4,我们有

(n4)p(42)+(n4)(1p)(t2)124n4p6+ntt!(1p)(t2)124+nt(et)pt2t2.

p=121/6n2/3n=t3/2(lnt)3/2,代入上面不等式即证!傻逼吧!我操!谁爱算谁算去!

练习

k4 为整数, F(Xk)k族.基集为 X.证明若 |F|<4k13k,则存在一个 4染色,使得4种颜色都在每个子集中被染到.

证明: 考虑随机4-染色.对每个 eF,令 Ae 为事件:e 中并不是4种颜色都出现.若 Ae 发生,则 e 中最多有三种颜色,故

P(Ae)14k(43)3k=3k4k1.

由于 F 中子集数目少于 4k13k ,故所有 e 发生的概率小于 1,因此存在这样的染色.

锦标赛(Tournament)

定义:独立变量

定义:锦标赛(Tournament)

一个 n 顶点的锦标赛是一个从 Kn 得来的有向图:给每条边一个方向。对边 ij,称其为一个弧,称 i 为头,j 为尾。

定义:Sk (相互吊打)

称一个锦标赛 T 满足条件 Sk,若对任意 k 大小的子集 A,都存在一个顶点 uV(T)A 使得 ux 对任意 xA 成立。

定理:相互吊打的一个充要条件

对任意 kZ+,如果

(nk)(112k)nk<1,

就存在一个 n顶点锦标塞,满足性质 Sk

证明: 我们来考虑随机锦标赛,即:对任意 ij,存在一个弧 ij,方向选取 12 概率且独立。 令 BT 不满足 Sk 的事件。

对任意 A([n]k),令 BA 为事件:对任意顶点 x[n]A,存在 uA 使得 ux。则

B=A([n]k)BA.

x[n]A,令 BA,x 为事件:存在一些 uA 使得 ux。则

BA=x[n]ABA,x.

显然 P(BA,x)=112k,且 BA,xx 独立。于是

P(BA)=xAP(BA,x)=(112k)nk.

因此

P(B)A([n]k)P(BA)=≤(nk)(112k)nk<1.

证毕。

推论

对任意 kZ+,存在一个最小的 f(k),使得存在 f(k) 顶点锦标赛满足 Sk


f(3)<91,因为

(913)(1123)913<1.

期望的线性性

关键观察

P(XE[X])>0,P(XE[X])>0.

从“P>0”即存在的观点来看,若问“存在……大于/小于”问题,可以考虑构造随机变量, E[X] 为此值。

定义:指示变量

对事件 A,定义

1A(x)={1,xA, 即A发生;0,xA.

我们有: E[1A]=P(A)

定义:无和(sum-free)

称集合 A 无和,若对任意 x,yA,则 x+yA

例:无和

[n] 的两个无和 n/2 子集为

  • {n/2+1,,n}
  • {m[n]: 2n}

事实上可以证明:无和子集 A[n] 至多为 n/2 元素。Hint:考虑 xA2x=x+xA

定理:无和集存在性

对任意非零整数集 A,其中存在无和子集 B,且 |B||A|3

证明: 选取 p 足够大,使得 p2(mod3)p>|a|aA。注意到我们有一个 Zp无和子集

S={p3+1,,2p3}.

我们声称:对任意 xZpAx={aA: ax(modp)S}Z 中无和。这是因为反设存在 a,b,cAx 使得 a+b=c,两边同乘以 xax+bx=cxS 中,与 S Zp无和矛盾。

现在,我们找一些 xZp 使得 |Ax||A|3. 任取 x,我们计算 E[|Ax|]。 注意到

E[|Ax|]=E[aA1ax(modp)S]=aAE[1ax(modp)S]=aAP(ax(modp)S).

注意到 p 为素数, aZp 上的左乘作用是自同构,帮 P(ax(modp)S)=|S||Zp|13。因此 E[|Ax|]aA13=|A|3,故存在这样的 |Ax| 使得 |Ax||A|3

定义:主导集(Dominating set)

给定图 G,称 G 的一个主导集 AV(G) 的一个子集,使得 uV(G)AA 中有一个邻点。

定理

G 是一个 n 阶图,最小度为 δ>1,则 G 有一个主导集 A,其至多包含 1+ln(1+δ)1+δn 个顶点。

证明: 待定 p(0,1)。在 V(G) 中任取顶点以概率 p。 令 A 为这些被取的顶点,并令 BV(G)A 中在 A 中无邻点的点集。则

因此,

P(bB)=(1p)1+dG(b)(1p)1+δep(1+δ).

最后一个不等式是由于 1+xex。因此,我们有

E[|B|]=E[bV(G)1bB]=bV(G)P(bB)nep(1+δ).

另一方面,我们有 E[|A|]=np,从而

E[|AB|]E[|A|+|B|]=E[|A|]+E[|B|]n(p+ep(1+δ)).

由微积分, p=ln(1+δ)1+δ 时右边最小,代入得 E[|AB|]1+ln(1+δ)1+δn。因此存在一种取法使主导集 |AB|1+ln(1+δ)1+δn

定义:α

α(G) 为 $G 中最大独立集大小。

定理

对任意图 Gα(G)vV(G)1d(v)+1,这里 d(v)v 的度。

证明:V(G)=[n],则对任意 i[n],令 NiiG 中的邻点集。令 Sn 为全体置换 π:[n][n] 的集合。

对给定置换 π,称 i[n]π好的,若 π(i)<π(j) 对任意 jNi 成立。令 Mπ 为全体 π好顶点。

我们声称 Mπ 为独立集。这是因为如果 i,jMπijE(G),不妨设 π(i)<π(j),则 jπ好,矛盾。

下面,我们均匀地选取 πSn,并计算 E[|Mπ|]。因为 |Mπ|=i[n]1i:π,我们有 E[|πM|]=i[n]P(i:π)=i[n]1d(i)+1。因此存在一个 πSN 使得 |Mπ|i[n]1d(i)+1。由 α(G) 的定义, α(G)RHS

推论(练习)

对任意图 Gn 顶点及 m 边, α(G)n22m+n

推论

Gn 个点及平均度数(即 d=2mn,则 α(G)n1+d

定义:Turan 图

Turan r 部图 Tr(n) 是一个 n 顶点图 G,使得 V(G)=V1V2Vr,且 |V1||V2||Vr||V1|+1,其中 abE(G) 当且仅当 aVibVjij

Tr(n) 是一个平衡完全 r 部图。

定理(Turan定理,估计形式)

GKr+1,则 e(G)r12rn2

定理(Turan定理,精确形式)

n 点图 GKr+1,则 e(G)ex(Tr(n))r12rn2

证明: 给定 n顶点无 Kr+1GV(G)=[n]。考虑一个函数 p: [n][0,1],使得

i[n]pi=1.

希望找 f(p)=ijE(G)pipj 的最大值,对任意给定的 p。假设 p 使 f(p) 取最大——为此,使 p(i)0 的顶点 i 的数量应当最小。

引理

{i: p(i)>0}G 中的一个子图。

证明: 否则,若存在 p(i),p(j)>0 使 ijE(G),令 Si=kNG(i)pkSj=kNG(j)pk。令 SiSj。则我们可以分配一个新函数 p: [n][0,1] 使得

p(i)=p(i)+p(j),p(j)=0,p(k)=p(k),k[n]{i,j}.

现在,我们有

f(p)=f(p)(piSi+pjSj)+(pi+pj)Si=f(p)+(SiSj)pjf(p).

p 的取法,我们看出 f(p)=f(p),但 p 有更少的正权顶点数,矛盾!

回到原题:S={1,2,,s}V(G) 为正权顶点。由引理,我们有 G[S]=KssrG 不含 Kr+1。则

maxpf(p)=12((1isp(i))21isp2(i))=12(11isp2(i))12(1s(1s1isp(i))2)=12(11s)12(11r).

另一方面, maxpf(p)e(G)n2,比较两边即证!

练习

  1. Xπ 为置换 π 的不动点数,求 E[Xπ],这里 πSn
  2. n 次硬币,求“连续数”的期望:比如 TTTHHHHTT 的连续数是3.

解: (1) 记事件 Aii 被固定.令 XiAi 的指示变量,则 Xπ=Xi.由对称性,

P(π(i)=j)=1n,j.

于是 P(Ai)=1n,从而

E[Xπ]=P(Ai)=1.

(2) 令 Xn 为前 n 次投掷的连续数.若 n+1 次投掷异于第 n 次,则 Xn+1=Xn+1,否则 Xn+1=Xn,于是

E[Xn+1]=12E[Xn]+12(E[Xn]+1).=E[Xn]+12.

X1=1,故 E[Xn]=n+12

练习:Sperner定理另证

F[n] 中独立系统.令 πSn[n] 中的随机排列.通过考虑集合

X={i: {π(1),π(2),,π(i)}F}

来证明 |F|(nn/2).

证明:F={A1,,A|F|}.由于 F 是独立系统且 X 中元素相互包含,X 中包含至多一个元素.

另一方面,令 Xi 为事件

{π(1),,π(|Ai|)}=Ai

的指示变量,则 |X|=Xi. 因为 {π(1),,π(|Ai|)} 的取法有 (n|Ai|) 种,我们有

E[Xi]=P({π(1),,π(|Ai|)}=Ai)=1(n|Ai|).

因此,我们有

1E[|X|]=i=1|F|E[Xi]=i=1|F|1(n|Ai|).

这是 L-Y-M 不等式.取 (n|Ai|)(nn/2) 即证.

削除方法

先前我们考虑的是经典概率;现在,我们把这种思想延伸出来,考虑随机事件并非总含有想要的性质的情况——有非常少的“瑕疵”。我们的想法是删掉所有的瑕疵,这样就可以得到想要的性质。

定理

Gn 顶点图,有平均度 1。则 α(G)n2d

证明:SV(G) 为随机子集:对任意 vV(G)P(vS)=p,这里 p 待定。

XS 中的顶点数,令 YG 中每个端点都在 S 中的边数。则 E[X]=npE[Y]=e(G)p2=nd2p2。令 p=1d,则

E[XY]=E[X]E[Y]=nd.

故存在子集 SV(G) 使得

|S|e(G[S])E[XY]=n2d.

现在,从 G[S] 的每条边中删除一个顶点,得到子集 SS,其大小至少为 |S|e(G[S])n2d。由于这样删除后 G[S] 无边,故 S 是一个独立集。

回忆

定理: (nk)21(k2)<1,则 R(k,k)>n特别地: R(k,k)>k2ke2

定理

对任意整数 nR(k,k)>n(nk)21(k2)

证明: 考虑 Kn 的随机2-染色,这里每条边染为红或蓝,概率1/2。对 A([n]k),令 XA 为指示变量:A 诱导一个完全单色图 Kk。则 E[XA]=212(k2).
X=A([n]k)XA 为单色 k子集的数量。则

E[X]=A([n]k)E[XA]=(nk)21(k2).

故存在一个 Kn 的 2-染色,单色 k子集数量至多为 E[X]=(nk)21(k2)。接下来,从每个单色子集中移除一个顶点,这至多删除 XE[X](nk)21(k2) 个顶点,但把单色子集全清除了。于是剩余的 n(nk)21(k2) 个顶点中,没有任何单色 k子集。

推论(练习)

R(k,k)>1e(1+o(1))k2k/2.

提示:固定 k,令 n(nk)21(k2) 最大。

练习

F([n]3)m 个子集的子集族,其中 mn3.证明存在子集 A[n] 使得

|A|2n3/233m,

F 中的集合没有一个被 A 包含.

证明:B[n] 为由 P(iB)=p 定义的随机子集,各边相互独立.令 X=|B|Y=|{eF: eB}|. 对任意 eF,令 Ye 为事件“ eB ”的指示变量,故 Y=eFYe.显然 E[Ye]=p3 (因为 F 的成员是三元集),故 E[Y]=mp3.显然, E[X]=np.于是

E[XY]=npmp3=p=n/3m2n3/233m.

存在一个 B 使得 XYE[XY]=2n3/233m.再从 B 中移除 F 中含于 B 的成员中任一个顶点,把剩下的集合记为 A 即可.

练习

Fn 元集的 r一致族子集.假设每个元素属于 Fd个成员.证明存在一个元素集合 S,使得

  • S 不包含 F 中的成员,且
  • |S|(11r)nd1r1

证明: 我们先要知道 F 有多大.令

M=|{(v,e): eF,ve}|.

对其双重计数.固定元素:由于每个元素属于 F 中的 d 个成员,我们有 M=nd.另一方面,固定成员:每个成员中有 r 个元素.因此 |M|=|F|r,从而 |F|=ndr

下面,令 A 为随机子集,P(vA)=p 待定且对各 v 独立.则

E[|A|]=np.

YF 的元素中位于 A 的元素的数量.由线性性,我们有

E[Y]=|F|pr=ndrpr.

因此,我们有

E[|A|Y]=npndrpr.

p=d1r1,则 E[|A|Y]=(11r)nd1r1.存在这样的一个 A|A|YE[|A|Y].从 F 的每个成员中删除一个位于 A 中的元素可获得一个集合 S,其中至少有 |A|Y 个元素,证毕.

Markov 不等式

定理:Markov 不等式

X0 为随机变量,t>0,则

P(Xt)E[X]t.

推论

Xn0 为整值随机变量。若

E[Xn]0,n,

P(Xn=0)1,n.

Xn=0 几乎一定成立。

引理

对随机图 G(n,p)p(0,1),有

P(α(G(n,p))2lnnp)1,n.

注意到 p 可视为 n 的一个函数。

证明:t=2lnnp。令 XnG(n,p) 中大小为 t+1 的独立集的数量。对任意 S([n]t+1),令 XS 为指标变量: S 是一个 G(n,p) 中的独立集。则

Xn=S([n]t+1)XS.

E[Xn]=S([n]t+1)E[XS]=S([n]t+1)(1p)(t+12)=(nt+1)(1p)(t+12)nt+1(t+1)!ep(t+12)=1(t+1)!(nept/2)t+11(t+1)!0.

上面的推论P(α(G(n,p))t)=P(Xn=0)1

定义:染色数

对一个图 G,其染色数 χ(G) 是最小的 k,使得 V(G) 可被分为 k 个独立集。

事实

  1. χ(Kn)=n
  2. χ(C2n+1)=3
  3. χ(G)2 当且仅当 G 是二分图。
  4. χ(G)α(G)|V(G)|

定义:围长(girth)

G 的围长 g(G)G 中最短圈的长度。

定理(Erdos)

对任一固定的 k,存在一个图 Gχ(G)kg(G)k

证明: 考虑一个随机图 G=G(n,p),这里 p 待定。令 t=2lnnp,由上面的引理可知 P(α(G)t)1,当 n

XnG 中长度小于 k 的圈的数量。则

E[Xn]=i=3k1n(n1)(ni+1)2ipi.

这里 n(n1)(ni+1)2iKnCi 的个数。则

E[Xn]i=3k1(np)i(np)k1np1.

Markov不等式

P(Xn>n2)E[Xn]n/22((np)k1)n(np1).

p=nk1k,则 np=n1/k。我们有

P(Xn>n2)2(n1)n(n1/k1)0.

n 足够大,则存在 n 点图 G ,满足 Xnn2α(G)t=2lnnp3nk1klnn

通过从每个长度至多为 k1 的圈中移除一个顶点,我们可以找到一个诱导子图 G<G,其含至少 n/2 个顶点,并且不存在长度最大为 k1 的圈。因此 g(G)k。由于 GG 的诱导子图,我们有

α(G)α(G)3nk1klnn.

χα|V|,得到 χ(G)|V(G|)α(G)n/23nk1klnnk,故 G 为所求图,如欲所证。