概率极限理论
约 2138 个字 2 张图片 预计阅读时间 7 分钟
伯努利大数定律
给定p∈(0,1),记Sn∼Binomial(n,p),则
P(w:∣nSn(w)−p∣⩾ϵ)→0(n→∞)
即频率与概率的偏差的概率随着试验次数的增加而趋近于0
Possion 极限定理
令 0<pn<1,假设 Sn∼B(n,pn),如果 npn→λ,并且 0<λ<1 那么对任何 k=0,1,2,…
P(Sn=k)→k!λke−λ,n→∞
证明:由于 Sn∼B(n,pn)
P(Sn=k)=k!(n−k)!n!pnk(1−pn)n−k
=k!1⋅nkn(n−1)⋯(n−k+1)⋅(npn)k⋅(1−nλ+o(n1))n−k
→k!λke−λ,n→∞
Chebyshev 大数律
Chebyshev 不等式: 对任意随机变量 X, EX 和 EX2 存在有限, 那么对任意 ε>0
P(∣X−EX∣>ε)⩽ε2Var(X)
应用 Chebyshev 不等式证明 Bernoulli 大数律
P(∣∣nSn−p∣∣>ε)=P(∣Sn−np∣>nε)
⩽n2ε2Var(Sn−np)
=n2ε2np(1−p)→0,n→∞
Chebyshev 大数律
假设 ξk,k⩾1 是一列随机变量,Eξk=μ。记 Sn=∑k=1nξk,如果
n2Var(Sn)→0,n→∞
那么
nSn→μ,n→∞
更一般地,假设 ξk,k⩾1 是一列随机变量,Eξk=μk。如果
n2Var(Sn)→0,n→∞
那么
nSn−n∑k=1nμk→0,n→∞
Chebyshev 大数律的证明
对任意 ε>0,
P(∣∣nSn−n∑k=1nμk∣∣>ε)⩽n2ε2Var(Sn)→0
这里Sn 对应Chebyshev不等式中的X,∑k=1nμk 对应Chebyshev不等式中的μ
nε 对应Chebyshev不等式中的ε
Chebyshev 大数律的意义:
1. 样本均值渐近逼近均值
-
没有独立性要求
-
Chebyshev 大数律的不足之处: 要求方差存在
Khinchin 大数律
假设 ξk,k⩾1 是一列独立同分布的随机变量,且 Eξk=μ,记 Sn=∑k=1nξk,那么
nSn→μ,n→∞
De Moivre-Laplace 中心极限定理
De Moivre公式
(cosθ+isinθ)n=cosnθ+isinnθ
假设 Sn∼B(n,p),那么
P(np(1−p)Sn−np⩽x)≈∫−∞x2π1e−2t2dt
Φ(x)=∫−∞x2π1e−2t2dt
P(a⩽Sn⩽b)=P(np(1−p)a−np⩽np(1−p)Sn−np⩽np(1−p)b−np)≈Φ(np(1−p)b−np)−Φ(np(1−p)a−np)
利用De Moivre-Laplace定理证明
在伯努利试验中,若p∈(0,1),则不管A是多大的常数,总有
P(∣μn−np∣<A)→0,n→∞
将其化为标准形式,则
P(∣np(1−p)μn−np∣<np(1−p)A)→0,n→∞
由De Moivre-Laplace定理,右边是趋向于0,所以原概率相当于
P(∣X∣<0)=2Φ(0)−1=0
其中 X 是标准正态分布
但是,这一结果是否与大数定律相矛盾呢,直观上理解有些困难,但是,我们将其化为大数定律的形式来看的话,就有
P(∣nμn−p∣<nA)→0,n→∞
但是大数定律的结论是,对于任意给定的ϵ>0,总有
P(∣nμn−p∣>ϵ)→0,n→∞
那么结果就很明了了,大数定律需要ϵ给定,但是这里的nA是与n有关一直变化的,并不满足大数定律的条件,所以,大数定律与这个结论并不矛盾,关键就在于A是给定的常数导致它除以n后,ϵ是变化的。
依概率收敛
(Ω,S,P) 是一个概率空间,X,Xn,n⩾1 是一列随机变量,如果对任意 ϵ>0,
P(ω:∣Xn(ω)−X(ω)∣>ϵ)→0,n→∞
称 Xn 依概率收敛到 X,记做 XnPX。
按此概念,Bernoulli 大数律可写成
nSnPp
依概率收敛的性质
如果 XnPX 且 XnPY,那么
P(X=Y)=1
证明
证明: 只需证明 P(X=Y)=0. 注意到,
P(X=Y)=P(∣X−Y∣>0)=P(∪m=1∞{∣X−Y∣>m1})
因此, 需要证明对任意 ϵ>0,
P(∣X−Y∣>ϵ)=0
给定 ϵ>0, 对任意 n⩾1
P(∣X−Y∣>ϵ)=P(∣(Xn−X)−(Xn−Y)∣>ϵ)
⩽P(∣Xn−X∣+∣Xn−Y∣>ϵ)
这里运用了三角不等式,小的发生,大的一定也发生;
⩽P(∣Xn−X∣>2ϵ)+P(∣Xn−Y∣>2ϵ)
这里是因为
{a+b>c}⊂{a>2c}∪{b>2c}
令 n→∞,
P(∣Xn−X∣>2ϵ)→0,P(∣Xn−Y∣>2ϵ)→0
因此
P(∣X−Y∣>ϵ)=0
因此, P(X=Y)=1
如果存在某 r>0, 成立
E∣Xn−X∣r→0,n→∞
那么
XnPX
如果 XnPX,YnPY, 那么
(i) Xn±YnPX±Y
(ii) Xn⋅YnPX⋅Y
(iii) 如果 P(Y=0)=1, 那么 YnXnPYX
假设 f:R↦R 是连续映射,如果 XnPX,那么
f(Xn)Pf(X)
证明
设 ϵ′>0,存在 M>0,使得
P(∣ξ∣⩾M)⩽P(∣ξ∣⩾2M)⩽4ϵ′
由于 ξnPξ,故存在 N1⩾1,当 n⩾N1 时,P(∣ξn−ξ∣⩾2M)⩽4ϵ′。因此
P(∣ξn∣⩾M)⩽P(∣ξn−ξ∣⩾2M)+P(∣ξ∣⩾2M)⩽2ϵ′
又因 f(x) 在 (−∞,∞) 上连续,从而在 [−M,M] 上一致连续。对给定的 ϵ>0,存在 δ>0,当 ∣x−y∣<δ 时,∣f(x)−f(y)∣<ϵ。这样
P(∣f(ξn)−f(ξ)∣⩾ϵ)⩽P(∣ξn−ξ∣⩾δ)+P(∣ξn∣⩾M)+P(∣ξ∣⩾M)
对上述的 δ,存在 N2⩾1,当 n⩾N2 时,
P(∣ξn−ξ∣⩾δ)⩽4ϵ′
当 n⩾max(N1,N2) 时,
P(∣f(ξn)−f(ξ)∣⩾ϵ)⩽4ϵ′+2ϵ′+4ϵ′=ϵ′
依分布收敛
假设 (Ω,Σ,P) 是概率空间,X,Xn,n⩾1 是一列随机变量,F,Fn,n⩾1 是一列相应的分布函数,如果对于 F 的任意连续点 x,
Fn(x)→F(x),n→∞
称 Fn 依分布收敛于 F,记 FndF 或者 XndX。
按此概念,中心极限定理可写成
np(1−p)Sn−npdN(0,1)
Tip
-
如果 F 是在 R 上连续, 那么 Fn 处处收敛到 F
-
一般地,F不是连续函数(左极限存在,右连续的函数)
-
既然 F 是单调有界函数,F 的不连续点集最多可数个:
DF={x:F(x)−F(x−)>0}=n=1⋃∞{x:F(x)−F(x−)⩾n1}
- F 的连续性点集在 R 上稠密。
依概率收敛与依分布收敛的关系
证明的关键在于构造夹逼项;
如果 ξnPξ,那么 ξndξ
假设 F 和 Fn 分别是 ξ 和 ξn 的分布函数,那么对任意给定 ϵ>0,有
(ξ⩽x−ϵ)=(ξ⩽x−ϵ,ξn⩽x)∪(ξ⩽x−ϵ,ξn>x)⊂(ξn⩽x)∪(ξn−ξ>ϵ)
因此
F(x−ϵ)⩽Fn(x)+P(ξn−ξ>ϵ)
令 n→∞,由于 P(ξn−ξ>ϵ)→0,所以
F(x−ϵ)⩽n→∞infFn(x)
同理
(ξn⩽x)⊂(ξ⩽x+ϵ)∪(ξ−ξn<−ϵ)
从而
F(x+ϵ)⩾n→∞supFn(x)
因此
n→∞limFn(x)=F(x)
但是如果 XndC,那么 XnPC
其中 C 是常数
如果 ξndc,则
n→∞limFn(x)={0,1,x<c,x⩾c.
因此对任意 ϵ>0,有
P(∣ξn−c∣⩾ϵ)=P(ξn⩾c+ϵ)+P(ξn⩽c−ϵ)
=1−P(ξn<c+ϵ)+P(ξn⩽c−ϵ)
=1−Fn(c+ϵ−0)+Fn(c−ϵ)→0.
定理证毕。
-
Levy 连续性定理:
假设 X,Xn,n⩾1 是一列随机变量,具有特征函数 ϕ,ϕn,n⩾1。那么
XndX⟺ϕn(t)→ϕ(t),t∈R
-
Levy 连续性定理的另一种形式:
假设 Xn,n⩾1 是一列随机变量,具有特征函数 ϕn,n⩾1。如果
ϕn(t)→ϕ(t),t∈R
并且 ϕ 在 0 处连续,那么 ϕ 一定是特征函数。记与 ϕ 相应的随机变量为 X,那么
XndX
运用Levy定理,如果要证明一列随机变量依分布收敛于某个随机变量,只需要证明这列随机变量的特征函数收敛于该随机变量的特征函数。
应用
回忆 ξk,k⩾1 独立同分布,Eξk=μ,那么
n1k=1∑nξkpμ
证明:只需证明
Xn=n1k=1∑nξkdμ
⟺ϕn(t)=EeitXn→eitμ
在 0 处进行 Taylor 展开,
Eeitξk=1+itμ+o(n1),n→∞
所以,对每个 t∈R,
ϕn(t)=(1+nitμ+o(n1))n→eitμ
回忆 ξk,k⩾1 独立同分布,Eξk=μ,Var(ξk)=σ2,那么
Xn=σn1k=1∑n(ξk−μ)dN(0,1)
证明:只需证明
ϕn(t)=EeitXn→e−2t2
注意到
EeitXn=[Eeiσnt(ξk−μ)]n
在 0 处进行 Taylor 展开,
Eeiσnt(ξk−μ)=1−2nt2+o(n1)
所以,对任意 t,
EeitXn=[1−2nt2+o(n1)]n→e−2t2
依分布收敛的性质
-
- 如果 XndX,an,bn→a,b,那么 anXn+bndaX+b
线性性:
- 如果 XndX,YnPY,那么 XnYndXY
-
连续映射保依分布收敛:
- 如果 XndX,且 f:R↦R 是连续映射,那么 f(Xn)df(X)
Helly引理
假设 F,Fn,n≥1 是一列分布函数,并且 FndF,那么对任意有界连续函数 g
∫g(x)dFn(x)→∫g(x)dF(x)
这样,对任意 t∈R,
Eeitf(Xn)=∫eitf(x)dFn(x)
→∫eitf(x)dF(x)
=Eeitf(X)
结论成立
心得
在证明这些性质时常用的放缩有
-
P(a<A)⩽P(b<A)(b<a) 大的发生(小于A),小的一定也发生
-
P(a>A)⩽P(b>A)(b>a) 小的发生(大于A),大的一定也发生
-
P(An)⩽P(An,Bn)+P(An,Bnc),至少有一个发生
-
P(An)⩾P(An,Bn) 条件加强,概率变小,反过来使用就是条件减弱,概率变大
Levy-Feller 中心极限定理
假设 ξk,k⩾1 是一列独立同分布随机变量,Eξk=μ,Var(ξk)=σ2。记 Sn=∑k=1nξk,那么对任意 x,
P(σnSn−nμ⩽x)→Φ(x)
即
σnSn−nμdN(0,1)
Levy-Feller 中心极限定理的意义
假设测量值为 Xi,真值为 μ。每次误差为 Xi−μ,n 次观测所得误差叠加,记为 ∑i=1n(Xi−μ)。那么
i=1∑n(Xi−μ)∼N(0,nσ2),n≫1
Lyapunov 中心极限定理
假设 ξk,k⩾1 是一列独立随机变量不一定同分布,Eξk=μk,Var(ξk)=σk2。记 Sn=∑k=1nξk,Bn=∑k=1nσk2。如果
- Bn→∞
- E∣ξk∣3<∞,且
Bn3/21k=1∑nE∣ξk−μk∣3→0,n→∞
那么对任意 x
P(Bn∑k=1n(ξk−μk)⩽x)→Φ(x)
即
Bn∑k=1n(ξk−μk)dN(0,1)
Lyapunov 中心极限定理的意义
Lindeberg 条件
假设 {ξn} 是独立随机变量序列,Fk 为对应分布函数,且每个变量有有限期望和方差 ak,σk2。
记 Bn2=∑k=1nσk2。
Lindeberg 条件为:
n→∞limBn21k=1∑n∫∣x−ak∣≥ϵBn(x−ak)2dFk(x)=0
几乎处处收敛
几乎处处收敛
- 处处收敛: 假设 (Ω,A,P) 是一个概率空间,X,Xn,n⩾1 是一列随机变量,如果对每个 ω∈Ω,
Xn(ω)→X(ω),n→∞
那么称 Xn 处处收敛于 X。
- 几乎处处收敛: 假设 (Ω,A,P) 是一个概率空间,X,Xn,n⩾1 是一列随机变量,如果存在 Ω0⊂Ω 使得
(i) P(Ω0)=0
(ii) 对每个 ω∈Ω∖Ω0,
Xn(ω)→X(ω),n→∞
那么称 Xn 几乎处处收敛于 X,记做 Xn→X,a.s.。
即除一个零概率事件外,Xn 处处收敛于 X。
Quote
对于几乎处处收敛和依概率收敛,两者的区别是依概率收敛先计算概率,再要求概率为1,而几乎处处收敛要求每一个样本空间的点的映射都收敛。
详情可以参考这篇文章几乎处处收敛与依概率收敛的区别
几乎处处收敛的判别法则
Xn→X, a.s.
当且仅当对任意 ϵ>0,
P(N=1⋂∞n=N⋃∞{∣Xn(ω)−X(ω)∣>ϵ})=0
或者说
P({∣Xn(ω)−X(ω)∣>ϵ}, i.o.)=0(i.o.表示无限次)
等价地, 对任意 ϵ>0,
N→∞limP(n=N⋃∞{∣Xn(ω)−X(ω)∣>ϵ})=0
由此, 也可看出几乎处处收敛比依概率收敛强。
这一部分的推导比较繁琐,这里就不敲上来了,直接附上我的手写版,勿怪
对于式子的理解
Borel-Cantelli 引理
- 假设 An,n⩾1 是一列事件,如果
n=1∑∞P(An)<∞
那么
P(An,i.o.)=0
证明:
P(An,i.o.)=P(N=1⋂∞n=N⋃∞An)=N→∞limP(n=N⋃∞An)(连续性)
P(n=N⋃∞An)⩽n=N∑∞P(An)→0(次可加性加Cauchy收敛)
- 假设 An,n⩾1 是一列独立事件,如果
n=1∑∞P(An)=∞
那么
P(An,i.o.)=1
证明:由于 An,n⩾1 是一列独立事件,那么
首先做如下转化
P(An,i.o.)=P(k=1⋂∞n=k⋃∞An)=1
⟺k→∞limP(n=k⋃∞An)=1
⟺P(n=k⋃∞An)=1,∀k⩾1(单调递减趋于1,只能为1)
⟺P(n=k⋂∞Anc)=0,∀k⩾1.(de Morgan)
P(n=N⋂MAnc)=n=N∏MP(Anc)=n=N∏M(1−P(An))
⩽n=N∏Me−P(An)=e−∑n=NMP(An)
N→∞limM→∞limP(n=N⋂MAnc)=0
Borel-Cantelli 引理又称为零一定律,即如果事件发生的概率之和有限,那么事件发生的次数是有限的(有无限次不发生),如果事件发生的概率之和无限,那么事件发生的次数是无限的。
Borel大数定律
假设 (Ω,A,P) 是一个概率空间,ξk,k⩾1 是一列独立同分布随机变量:
P(ξk=1)=p,P(ξk=0)=1−p
记 Sn=∑k=1nξk,那么 Sn/n→p,a.s.
证明:对任意 ϵ>0
P(∣∣nSn−p∣∣>ϵ,i.o.)=0
由 Borel-Cantelli 引理,只需证明
n=1∑∞P(∣∣nSn−p∣∣>ϵ)<∞
由 Markov 不等式,
P(∣∣nSn−p∣∣>ϵ)⩽n4ϵ4E∣Sn−np∣4
容易计算得,
E∣Sn−np∣4=np(1−p)[(1−p)3+(1−p)2]+n(n−1)p2(1−p)2
因此,
n=1∑∞P(∣∣nSn−p∣∣>ϵ)⩽K(ϵ,p)n=1∑∞n21<∞
Kolmogorov 大数律
假设 (Ω,A,P) 是一个概率空间,ξk,k⩾1 是一列独立同分布随机变量。如果 Eξk=μ,那么
nSn→μ,a.s.
- Kolmogorov 强大数律推广了 Borel 强大数律
- Kolmogorov 强大数律推广了 Khinchine 大数律