跳转至

概率极限理论

约 2138 个字 2 张图片 预计阅读时间 7 分钟

伯努利大数定律

给定p(0,1)p \in (0, 1),记SnBinomial(n,p)S_n \sim \text{Binomial}(n, p),则

P(w:Sn(w)npϵ)0(n) P(w: \lvert \frac{S_n(w)}{n} - p \rvert \geqslant \epsilon) \to 0 \quad (n \to \infty)

即频率与概率的偏差的概率随着试验次数的增加而趋近于0

Possion 极限定理

0<pn<10 < p_n < 1,假设 SnB(n,pn)S_n \sim B(n, p_n),如果 npnλnp_n \to \lambda,并且 0<λ<10 < \lambda < 1 那么对任何 k=0,1,2,k = 0, 1, 2, \ldots

P(Sn=k)λkeλk!,n P(S_n = k) \to \frac{\lambda^k e^{-\lambda}}{k!}, \quad n \to \infty

证明:由于 SnB(n,pn)S_n \sim B(n, p_n)

P(Sn=k)=n!k!(nk)!pnk(1pn)nk P(S_n = k) = \frac{n!}{k!(n-k)!} p_n^k (1-p_n)^{n-k}
=1k!n(n1)(nk+1)nk(npn)k(1λn+o(1n))nk = \frac{1}{k!} \cdot \frac{n(n-1)\cdots(n-k+1)}{n^k} \cdot (np_n)^k \cdot \left(1 - \frac{\lambda}{n} + o\left(\frac{1}{n}\right)\right)^{n-k}
λkeλk!,n \to \frac{\lambda^k e^{-\lambda}}{k!}, \quad n \to \infty

Chebyshev 大数律

Chebyshev 不等式: 对任意随机变量 XX, EXEXEX2EX^2 存在有限, 那么对任意 ε>0\varepsilon > 0

P(XEX>ε)Var(X)ε2 P(|X - EX| > \varepsilon) \leqslant \frac{Var(X)}{\varepsilon^2}

应用 Chebyshev 不等式证明 Bernoulli 大数律

P(Snnp>ε)=P(Snnp>nε) P\left(\left|\frac{S_n}{n} - p\right| > \varepsilon\right) = P(|S_n - np| > n\varepsilon)
Var(Snnp)n2ε2 \leqslant \frac{Var(S_n - np)}{n^2 \varepsilon^2}
=np(1p)n2ε20,n = \frac{np(1-p)}{n^2 \varepsilon^2} \to 0, \quad n \to \infty

Chebyshev 大数律

假设 ξk,k1\xi_k, k \geqslant 1 是一列随机变量,Eξk=μE\xi_k = \mu。记 Sn=k=1nξkS_n = \sum_{k=1}^{n} \xi_k,如果

Var(Sn)n20,n \frac{Var(S_n)}{n^2} \to 0, \quad n \to \infty

那么

Snnμ,n \frac{S_n}{n} \to \mu, \quad n \to \infty

更一般地,假设 ξk,k1\xi_k, k \geqslant 1 是一列随机变量,Eξk=μkE\xi_k = \mu_k。如果

Var(Sn)n20,n \frac{Var(S_n)}{n^2} \to 0, \quad n \to \infty

那么

Snnk=1nμkn0,n \frac{S_n}{n} - \frac{\sum_{k=1}^{n} \mu_k}{n} \to 0, \quad n \to \infty

Chebyshev 大数律的证明

对任意 ε>0\varepsilon > 0,

P(Snnk=1nμkn>ε)Var(Sn)n2ε20 P\left(\left|\frac{S_n}{n} - \frac{\sum_{k=1}^{n} \mu_k}{n}\right| > \varepsilon\right) \leqslant \frac{Var(S_n)}{n^2 \varepsilon^2} \to 0

这里SnS_n 对应Chebyshev不等式中的XXk=1nμk\sum_{k=1}^{n} \mu_k 对应Chebyshev不等式中的μ\mu

nεn\varepsilon 对应Chebyshev不等式中的ε\varepsilon

Chebyshev 大数律的意义: 1. 样本均值渐近逼近均值

  1. 没有独立性要求

  2. Chebyshev 大数律的不足之处: 要求方差存在

Khinchin 大数律

假设 ξk,k1\xi_k, k \geqslant 1 是一列独立同分布的随机变量,且 Eξk=μE\xi_k = \mu,记 Sn=k=1nξkS_n = \sum_{k=1}^{n} \xi_k,那么

Snnμ,n \frac{S_n}{n} \to \mu, \quad n \to \infty

De Moivre-Laplace 中心极限定理

De Moivre公式

(cosθ+isinθ)n=cosnθ+isinnθ (\cos \theta + i \sin \theta)^n = \cos n\theta + i \sin n\theta

假设 SnB(n,p)S_n \sim B(n, p),那么

P(Snnpnp(1p)x)x12πet22dt P\left( \frac{S_n - np}{\sqrt{np(1-p)}} \leqslant x \right) \approx \int_{-\infty}^{x} \frac{1}{\sqrt{2\pi}} e^{-\frac{t^2}{2}} \, dt
  • 左边:规范化 Snnpnp(1p)\frac{S_n - np}{\sqrt{np(1-p)}} 随机变量的分布函数

  • 右边:正态分布函数

Φ(x)=x12πet22dt \Phi(x) = \int_{-\infty}^{x} \frac{1}{\sqrt{2\pi}} e^{-\frac{t^2}{2}} \, dt
P(aSnb)=P(anpnp(1p)Snnpnp(1p)bnpnp(1p))Φ(bnpnp(1p))Φ(anpnp(1p)) P(a \leqslant S_n \leqslant b) = P\left( \frac{a - np}{\sqrt{np(1-p)}} \leqslant \frac{S_n - np}{\sqrt{np(1-p)}} \leqslant \frac{b - np}{\sqrt{np(1-p)}} \right) \approx \Phi\left( \frac{b - np}{\sqrt{np(1-p)}} \right) - \Phi\left( \frac{a - np}{\sqrt{np(1-p)}} \right)

利用De Moivre-Laplace定理证明

在伯努利试验中,若p(0,1)p \in (0, 1),则不管AA是多大的常数,总有

P(μnnp<A)0,n P(\lvert \mu_n - np \rvert < A) \to 0, \quad n \to \infty

将其化为标准形式,则

P(μnnpnp(1p)<Anp(1p))0,n P(\lvert \dfrac{\mu_n - np}{\sqrt{np(1-p)}} \rvert < \frac{A}{\sqrt{np(1-p)}})\to 0, \quad n \to \infty

由De Moivre-Laplace定理,右边是趋向于0,所以原概率相当于

P(X<0)=2Φ(0)1=0 P(|X| < 0) = 2 \Phi(0) - 1 = 0

其中 XX 是标准正态分布

但是,这一结果是否与大数定律相矛盾呢,直观上理解有些困难,但是,我们将其化为大数定律的形式来看的话,就有

P(μnnp<An)0,n P(\lvert \dfrac{\mu_n}{n} - p \rvert < \dfrac{A}{n}) \to 0, \quad n \to \infty

但是大数定律的结论是,对于任意给定的ϵ>0\epsilon > 0,总有

P(μnnp>ϵ)0,n P(\lvert \dfrac{\mu_n}{n} - p \rvert > \epsilon) \to 0, \quad n \to \infty

那么结果就很明了了,大数定律需要ϵ\epsilon给定,但是这里的An\dfrac{A}{n}是与nn有关一直变化的,并不满足大数定律的条件,所以,大数定律与这个结论并不矛盾,关键就在于AA是给定的常数导致它除以nn后,ϵ\epsilon是变化的。

依概率收敛

(Ω,S,P)(\Omega, \mathcal{S}, P) 是一个概率空间,X,Xn,n1X, X_n, n \geqslant 1 是一列随机变量,如果对任意 ϵ>0\epsilon > 0,

P(ω:Xn(ω)X(ω)>ϵ)0,n P(\omega : |X_n(\omega) - X(\omega)| > \epsilon) \to 0, \quad n \to \infty

XnX_n 依概率收敛到 XX,记做 XnPXX_n \xrightarrow{P} X

按此概念,Bernoulli 大数律可写成

SnnPp \frac{S_n}{n} \xrightarrow{P} p

依概率收敛的性质

如果 XnPXX_n \xrightarrow{P} XXnPYX_n \xrightarrow{P} Y,那么

P(X=Y)=1 P(X=Y) = 1
证明
证明: 只需证明 P(XY)=0. 注意到, \text{证明: 只需证明 } P(X \neq Y) = 0. \text{ 注意到,}
P(XY)=P(XY>0)=P(m=1{XY>1m}) P(X \neq Y) = P(|X - Y| > 0) = P(\cup_{m=1}^{\infty}\{ |X - Y| > \frac{1}{m} \})

因此, 需要证明对任意 ϵ>0\epsilon > 0,

P(XY>ϵ)=0 P(|X - Y| > \epsilon) = 0

给定 ϵ>0\epsilon > 0, 对任意 n1n \geqslant 1

P(XY>ϵ)=P((XnX)(XnY)>ϵ) P(|X - Y| > \epsilon) = P(|(X_n - X) - (X_n - Y)| > \epsilon)
P(XnX+XnY>ϵ) \leqslant P(|X_n - X| + |X_n - Y| > \epsilon)

这里运用了三角不等式,小的发生,大的一定也发生;

P(XnX>ϵ2)+P(XnY>ϵ2) \leqslant P(|X_n - X| > \frac{\epsilon}{2}) + P(|X_n - Y| > \frac{\epsilon}{2})

这里是因为

{a+b>c}{a>c2}{b>c2} \{a+b>c\} \subset \{a>\frac{c}{2}\} \cup \{b>\frac{c}{2}\}

nn \to \infty,

P(XnX>ϵ2)0,P(XnY>ϵ2)0 P(|X_n - X| > \frac{\epsilon}{2}) \to 0, \quad P(|X_n - Y| > \frac{\epsilon}{2}) \to 0

因此

P(XY>ϵ)=0 P(|X - Y| > \epsilon) = 0
因此, P(X=Y)=1 \text{因此, } P(X = Y) = 1

如果存在某 r>0r > 0, 成立

EXnXr0,n E|X_n - X|^r \to 0, \quad n \to \infty

那么

XnPX X_n \xrightarrow{P} X

如果 XnPX,YnPYX_n \xrightarrow{P} X, Y_n \xrightarrow{P} Y, 那么

(i) Xn±YnPX±YX_n \pm Y_n \xrightarrow{P} X \pm Y

(ii) XnYnPXYX_n \cdot Y_n \xrightarrow{P} X \cdot Y

(iii) 如果 P(Y0)=1P(Y \neq 0) = 1, 那么 XnYnPXY\frac{X_n}{Y_n} \xrightarrow{P} \frac{X}{Y}

假设 f:RRf: \mathbb{R} \mapsto \mathbb{R} 是连续映射,如果 XnPXX_n \xrightarrow{P} X,那么

f(Xn)Pf(X) f(X_n) \xrightarrow{P} f(X)
证明

ϵ>0\epsilon' > 0,存在 M>0M > 0,使得

P(ξM)P(ξM2)ϵ4 P(|\xi| \geqslant M) \leqslant P(|\xi| \geqslant \frac{M}{2}) \leqslant \frac{\epsilon'}{4}

由于 ξnPξ\xi_n \xrightarrow{P} \xi,故存在 N11N_1 \geqslant 1,当 nN1n \geqslant N_1 时,P(ξnξM2)ϵ4P(|\xi_n - \xi| \geqslant \frac{M}{2}) \leqslant \frac{\epsilon'}{4}。因此

P(ξnM)P(ξnξM2)+P(ξM2)ϵ2 P(|\xi_n| \geqslant M) \leqslant P(|\xi_n - \xi| \geqslant \frac{M}{2}) + P(|\xi| \geqslant \frac{M}{2}) \leqslant \frac{\epsilon'}{2}

又因 f(x)f(x)(,)(-\infty, \infty) 上连续,从而在 [M,M][-M, M] 上一致连续。对给定的 ϵ>0\epsilon > 0,存在 δ>0\delta > 0,当 xy<δ|x - y| < \delta 时,f(x)f(y)<ϵ|f(x) - f(y)| < \epsilon。这样

P(f(ξn)f(ξ)ϵ)P(ξnξδ)+P(ξnM)+P(ξM) P(|f(\xi_n) - f(\xi)| \geqslant \epsilon) \leqslant P(|\xi_n - \xi| \geqslant \delta) + P(|\xi_n| \geqslant M) + P(|\xi| \geqslant M)

对上述的 δ\delta,存在 N21N_2 \geqslant 1,当 nN2n \geqslant N_2 时,

P(ξnξδ)ϵ4 P(|\xi_n - \xi| \geqslant \delta) \leqslant \frac{\epsilon'}{4}

nmax(N1,N2)n \geqslant \max(N_1, N_2) 时,

P(f(ξn)f(ξ)ϵ)ϵ4+ϵ2+ϵ4=ϵ P(|f(\xi_n) - f(\xi)| \geqslant \epsilon) \leqslant \frac{\epsilon'}{4} + \frac{\epsilon'}{2} + \frac{\epsilon'}{4} = \epsilon'

依分布收敛

假设 (Ω,Σ,P)(\Omega, \Sigma, P) 是概率空间,X,Xn,n1X, X_n, n \geqslant 1 是一列随机变量,F,Fn,n1F, F_n, n \geqslant 1 是一列相应的分布函数,如果对于 FF 的任意连续点 xx,

Fn(x)F(x),n F_n(x) \to F(x), \quad n \to \infty

FnF_n 依分布收敛于 FF,记 FndFF_n \xrightarrow{d} F 或者 XndXX_n \xrightarrow{d} X

按此概念,中心极限定理可写成

Snnpnp(1p)dN(0,1) \frac{S_n - np}{\sqrt{np(1-p)}} \xrightarrow{d} N(0, 1)

Tip

  • 如果 F F 是在 R\mathbb{R} 上连续, 那么 Fn F_n 处处收敛到 F F

  • 一般地,F F 不是连续函数(左极限存在,右连续的函数)

  • 既然 FF 是单调有界函数,FF 的不连续点集最多可数个:

DF={x:F(x)F(x)>0}=n=1{x:F(x)F(x)1n} D_F = \{x : F(x) - F(x-) > 0\} = \bigcup_{n=1}^{\infty} \left\{x : F(x) - F(x-) \geqslant \frac{1}{n}\right\}
  • FF 的连续性点集在 R\mathbb{R} 上稠密。

依概率收敛与依分布收敛的关系

证明的关键在于构造夹逼项;

如果 ξnPξ \xi_n \xrightarrow{P} \xi ,那么 ξndξ \xi_n \xrightarrow{d} \xi

假设 FFFnF_n 分别是 ξ\xiξn\xi_n 的分布函数,那么对任意给定 ϵ>0\epsilon > 0,有

(ξxϵ)=(ξxϵ,ξnx)(ξxϵ,ξn>x)(ξnx)(ξnξ>ϵ) (\xi \leqslant x - \epsilon) = (\xi \leqslant x - \epsilon, \xi_n \leqslant x) \cup (\xi \leqslant x - \epsilon, \xi_n > x) \subset (\xi_n \leqslant x) \cup (\xi_n - \xi > \epsilon)

因此

F(xϵ)Fn(x)+P(ξnξ>ϵ) F(x - \epsilon) \leqslant F_n(x) + P(\xi_n - \xi > \epsilon)

nn \to \infty,由于 P(ξnξ>ϵ)0P(\xi_n - \xi > \epsilon) \to 0,所以

F(xϵ)infnFn(x) F(x - \epsilon) \leqslant \inf_{n \to \infty} F_n(x)

同理

(ξnx)(ξx+ϵ)(ξξn<ϵ) (\xi_n \leqslant x) \subset (\xi \leqslant x + \epsilon) \cup (\xi - \xi_n < -\epsilon)

从而

F(x+ϵ)supnFn(x) F(x + \epsilon) \geqslant \sup_{n \to \infty} F_n(x)

因此

limnFn(x)=F(x) \lim_{n \to \infty} F_n(x) = F(x)

但是如果 XndCX_n \xrightarrow{d} C,那么 XnPCX_n \xrightarrow{P} C

其中 CC 是常数

如果 ξndc\xi_n \xrightarrow{d} c,则

limnFn(x)={0,x<c,1,xc. \lim_{n \to \infty} F_n(x) = \begin{cases} 0, & x < c, \\ 1, & x \geqslant c. \end{cases}

因此对任意 ϵ>0\epsilon > 0,有

P(ξncϵ)=P(ξnc+ϵ)+P(ξncϵ) P(|\xi_n - c| \geqslant \epsilon) = P(\xi_n \geqslant c + \epsilon) + P(\xi_n \leqslant c - \epsilon)
=1P(ξn<c+ϵ)+P(ξncϵ) = 1 - P(\xi_n < c + \epsilon) + P(\xi_n \leqslant c - \epsilon)
=1Fn(c+ϵ0)+Fn(cϵ)0. = 1 - F_n(c + \epsilon - 0) + F_n(c - \epsilon) \to 0.

定理证毕。

  • Levy 连续性定理:

    假设 X,Xn,n1X, X_n, n \geqslant 1 是一列随机变量,具有特征函数 ϕ,ϕn,n1\phi, \phi_n, n \geqslant 1。那么

    XndX    ϕn(t)ϕ(t),tR X_n \xrightarrow{d} X \iff \phi_n(t) \to \phi(t), \quad t \in \mathbb{R}
  • Levy 连续性定理的另一种形式:

    假设 Xn,n1X_n, n \geqslant 1 是一列随机变量,具有特征函数 ϕn,n1\phi_n, n \geqslant 1。如果

    ϕn(t)ϕ(t),tR \phi_n(t) \to \phi(t), \quad t \in \mathbb{R}

    并且 ϕ\phi 在 0 处连续,那么 ϕ\phi 一定是特征函数。记与 ϕ\phi 相应的随机变量为 XX,那么

    XndX X_n \xrightarrow{d} X

运用Levy定理,如果要证明一列随机变量依分布收敛于某个随机变量,只需要证明这列随机变量的特征函数收敛于该随机变量的特征函数。

应用

回忆 ξk,k1\xi_k, k \geqslant 1 独立同分布,Eξk=μE\xi_k = \mu,那么

1nk=1nξkpμ \frac{1}{n} \sum_{k=1}^{n} \xi_k \xrightarrow{p} \mu

证明:只需证明

Xn=1nk=1nξkdμ X_n = \frac{1}{n} \sum_{k=1}^{n} \xi_k \xrightarrow{d} \mu
    ϕn(t)=EeitXneitμ \iff \quad \phi_n(t) = E e^{itX_n} \to e^{it\mu}

在 0 处进行 Taylor 展开,

Eeitξk=1+itμ+o(1n),n E e^{it\xi_k} = 1 + it\mu + o\left(\frac{1}{n}\right), \quad n \to \infty

所以,对每个 tRt \in \mathbb{R},

ϕn(t)=(1+itμn+o(1n))neitμ \phi_n(t) = \left(1 + \frac{it\mu}{n} + o\left(\frac{1}{n}\right)\right)^n \to e^{it\mu}

回忆 ξk,k1\xi_k, k \geqslant 1 独立同分布,Eξk=μ,Var(ξk)=σ2E\xi_k = \mu, \operatorname{Var}(\xi_k) = \sigma^2,那么

Xn=1σnk=1n(ξkμ)dN(0,1) X_n = \frac{1}{\sigma \sqrt{n}} \sum_{k=1}^{n} (\xi_k - \mu) \xrightarrow{d} N(0, 1)

证明:只需证明

ϕn(t)=EeitXnet22 \phi_n(t) = E e^{itX_n} \to e^{-\frac{t^2}{2}}

注意到

EeitXn=[Eeit(ξkμ)σn]n E e^{itX_n} = \left[E e^{i\frac{t(\xi_k - \mu)}{\sigma \sqrt{n}}}\right]^n

在 0 处进行 Taylor 展开,

Eeit(ξkμ)σn=1t22n+o(1n) E e^{i\frac{t(\xi_k - \mu)}{\sigma \sqrt{n}}} = 1 - \frac{t^2}{2n} + o\left(\frac{1}{n}\right)

所以,对任意 tt,

EeitXn=[1t22n+o(1n)]net22 E e^{itX_n} = \left[1 - \frac{t^2}{2n} + o\left(\frac{1}{n}\right)\right]^n \to e^{-\frac{t^2}{2}}

依分布收敛的性质

    • 如果 XndXX_n \xrightarrow{d} Xan,bna,ba_n,b_n \rightarrow a,b,那么 anXn+bndaX+ba_nX_n + b_n \xrightarrow{d} aX + b

    线性性:

    • 如果 XndXX_n \xrightarrow{d} XYnPYY_n \xrightarrow{P} Y,那么 XnYndXYX_n Y_n \xrightarrow{d} X Y
  • 连续映射保依分布收敛:

    • 如果 XndXX_n \xrightarrow{d} X,且 f:RRf: \mathbb{R} \mapsto \mathbb{R} 是连续映射,那么 f(Xn)df(X)f(X_n) \xrightarrow{d} f(X)

Helly引理

假设 F,Fn,n1F, F_n, n \geq 1 是一列分布函数,并且 FndFF_n \xrightarrow{d} F,那么对任意有界连续函数 gg

g(x)dFn(x)g(x)dF(x) \int g(x) dF_n(x) \to \int g(x) dF(x)

这样,对任意 tRt \in \mathbb{R},

Eeitf(Xn)=eitf(x)dFn(x) E e^{itf(X_n)} = \int e^{itf(x)} dF_n(x)
eitf(x)dF(x) \to \int e^{itf(x)} dF(x)
=Eeitf(X) = E e^{itf(X)}

结论成立

线性性的手写证明

查看

心得

在证明这些性质时常用的放缩有

  • P(a<A)P(b<A)(b<a)P( a < A) \leqslant P( b < A ) (b<a) 大的发生(小于A),小的一定也发生

  • P(a>A)P(b>A)(b>a)P(a > A) \leqslant P(b > A) (b > a) 小的发生(大于A),大的一定也发生

  • P(An)P(An,Bn)+P(An,Bnc)P(A_n) \leqslant P(A_n,B_n)+P(A_n,B_n^c),至少有一个发生

  • P(An)P(An,Bn)P(A_n) \geqslant P(A_n,B_n) 条件加强,概率变小,反过来使用就是条件减弱,概率变大

Levy-Feller 中心极限定理

  • Levy-Feller 中心极限定理

假设 ξk,k1\xi_k, k \geqslant 1 是一列独立同分布随机变量,Eξk=μ,Var(ξk)=σ2E\xi_k = \mu, \operatorname{Var}(\xi_k) = \sigma^2。记 Sn=k=1nξkS_n = \sum_{k=1}^{n} \xi_k,那么对任意 xx,

P(Snnμσnx)Φ(x) P\left( \frac{S_n - n\mu}{\sigma \sqrt{n}} \leqslant x \right) \to \Phi(x)

SnnμσndN(0,1) \frac{S_n - n\mu}{\sigma \sqrt{n}} \xrightarrow{d} N(0, 1)

Levy-Feller 中心极限定理的意义

  • 应用于一般随机变量,推广了 de Moivre-Laplace 中心极限定理。

  • 说明测量误差可用正态分布描述,即正态分布无处不在。

假设测量值为 XiX_i,真值为 μ\mu。每次误差为 XiμX_i - \munn 次观测所得误差叠加,记为 i=1n(Xiμ)\sum_{i=1}^{n}(X_i - \mu)。那么

i=1n(Xiμ)N(0,nσ2),n1 \sum_{i=1}^{n}(X_i - \mu) \sim N(0, n\sigma^2), \quad n \gg 1

Lyapunov 中心极限定理

假设 ξk,k1\xi_k, k \geqslant 1 是一列独立随机变量不一定同分布Eξk=μkE\xi_k = \mu_kVar(ξk)=σk2\operatorname{Var}(\xi_k) = \sigma_k^2。记 Sn=k=1nξkS_n = \sum_{k=1}^{n} \xi_kBn=k=1nσk2B_n = \sum_{k=1}^{n} \sigma_k^2。如果

  1. BnB_n \to \infty
  2. Eξk3<E|\xi_k|^3 < \infty,且
1Bn3/2k=1nEξkμk30,n \frac{1}{B_n^{3/2}} \sum_{k=1}^{n} E|\xi_k - \mu_k|^3 \to 0, \quad n \to \infty

那么对任意 xx

P(k=1n(ξkμk)Bnx)Φ(x) P\left(\frac{\sum_{k=1}^{n} (\xi_k - \mu_k)}{\sqrt{B_n}} \leqslant x\right) \to \Phi(x)

k=1n(ξkμk)BndN(0,1) \frac{\sum_{k=1}^{n} (\xi_k - \mu_k)}{\sqrt{B_n}} \xrightarrow{d} N(0, 1)

Lyapunov 中心极限定理的意义

  • 推广了 Levy-Feller 中心极限定理。

  • 解决了不同分布的随机变量和的中心极限问题。

  • Lyapunov 条件可以推出 Lindeberg 条件

Lindeberg 条件

假设 {ξn}\{\xi_n\} 是独立随机变量序列,FkF_k 为对应分布函数,且每个变量有有限期望和方差 ak,σk2a_k, \sigma_k^2

Bn2=k=1nσk2B_n^2 = \sum_{k=1}^{n} \sigma_k^2

Lindeberg 条件为:

limn1Bn2k=1nxakϵBn(xak)2dFk(x)=0 \lim_{n \to \infty} \frac{1}{B_n^2} \sum_{k=1}^{n} \int_{|x-a_k| \geq \epsilon B_n} (x-a_k)^2 dF_k(x) = 0

几乎处处收敛

几乎处处收敛

  • 处处收敛: 假设 (Ω,A,P)(\Omega, \mathcal{A}, P) 是一个概率空间,X,Xn,n1X, X_n, n \geqslant 1 是一列随机变量,如果对每个 ωΩ\omega \in \Omega,
Xn(ω)X(ω),n X_n(\omega) \to X(\omega), \quad n \to \infty

那么称 XnX_n 处处收敛于 XX

  • 几乎处处收敛: 假设 (Ω,A,P)(\Omega, \mathcal{A}, P) 是一个概率空间,X,Xn,n1X, X_n, n \geqslant 1 是一列随机变量,如果存在 Ω0Ω\Omega_0 \subset \Omega 使得

(i) P(Ω0)=0P(\Omega_0) = 0

(ii) 对每个 ωΩΩ0\omega \in \Omega \setminus \Omega_0,

Xn(ω)X(ω),n X_n(\omega) \to X(\omega), \quad n \to \infty

那么称 XnX_n 几乎处处收敛于 XX,记做 XnX,a.s.X_n \to X, a.s.

即除一个零概率事件外,XnX_n 处处收敛于 XX

Quote

对于几乎处处收敛和依概率收敛,两者的区别是依概率收敛先计算概率,再要求概率为1,而几乎处处收敛要求每一个样本空间的点的映射都收敛。

详情可以参考这篇文章几乎处处收敛与依概率收敛的区别

几乎处处收敛的判别法则

XnX, a.s.X_n \to X, \ a.s.

当且仅当对任意 ϵ>0\epsilon > 0,

P(N=1n=N{Xn(ω)X(ω)>ϵ})=0 P\left(\bigcap_{N=1}^{\infty} \bigcup_{n=N}^{\infty} \{|X_n(\omega) - X(\omega)| > \epsilon\}\right) = 0

或者说

P({Xn(ω)X(ω)>ϵ}, i.o.)=0(i.o.表示无限次) P(\{|X_n(\omega) - X(\omega)| > \epsilon\}, \ i.o.) = 0(i.o.表示无限次)

等价地, 对任意 ϵ>0\epsilon > 0,

limNP(n=N{Xn(ω)X(ω)>ϵ})=0 \lim_{N \to \infty} P\left(\bigcup_{n=N}^{\infty} \{|X_n(\omega) - X(\omega)| > \epsilon\}\right) = 0

由此, 也可看出几乎处处收敛比依概率收敛强。

这一部分的推导比较繁琐,这里就不敲上来了,直接附上我的手写版,勿怪

几乎处处收敛的判别法则
对于式子的理解

Borel-Cantelli 引理

  • 假设 An,n1A_n, n \geqslant 1 是一列事件,如果
n=1P(An)< \sum_{n=1}^{\infty} P(A_n) < \infty

那么

P(An,i.o.)=0 P(A_n, i.o.) = 0

证明:

P(An,i.o.)=P(N=1n=NAn)=limNP(n=NAn)(连续性) P(A_n, i.o.) =P(\bigcap_{N=1}^{\infty} \bigcup_{n=N}^{\infty} A_n) =\lim_{N \to \infty} P\left(\bigcup_{n=N}^{\infty} A_n\right)(\text{连续性})
P(n=NAn)n=NP(An)0(次可加性加Cauchy收敛) P\left(\bigcup_{n=N}^{\infty} A_n\right) \leqslant \sum_{n=N}^{\infty} P(A_n) \to 0(\text{次可加性加Cauchy收敛})
  • 假设 An,n1A_n, n \geqslant 1 是一列独立事件,如果
n=1P(An)= \sum_{n=1}^{\infty} P(A_n) = \infty

那么

P(An,i.o.)=1 P(A_n, i.o.) = 1

证明:由于 An,n1A_n, n \geqslant 1 是一列独立事件,那么

首先做如下转化

P(An,i.o.)=P(k=1n=kAn)=1 P(A_n, i.o.) = P\left(\bigcap_{k=1}^{\infty} \bigcup_{n=k}^{\infty} A_n\right) = 1
    limkP(n=kAn)=1 \iff \lim_{k \to \infty} P\left(\bigcup_{n=k}^{\infty} A_n\right) = 1
    P(n=kAn)=1,k1(单调递减趋于1,只能为1) \iff P\left(\bigcup_{n=k}^{\infty} A_n\right) = 1, \forall k \geqslant 1 \quad (\text{单调递减趋于1,只能为1})
    P(n=kAnc)=0,k1.(de Morgan) \iff P\left(\bigcap_{n=k}^{\infty} A_n^c\right) = 0, \forall k \geqslant 1. \quad (\text{de Morgan})
P(n=NMAnc)=n=NMP(Anc)=n=NM(1P(An)) P\left(\bigcap_{n=N}^{M} A_n^c\right) = \prod_{n=N}^{M} P(A_n^c) = \prod_{n=N}^{M} (1 - P(A_n))
n=NMeP(An)=en=NMP(An) \leqslant \prod_{n=N}^{M} e^{-P(A_n)} = e^{-\sum_{n=N}^{M} P(A_n)}
limNlimMP(n=NMAnc)=0 \lim_{N \to \infty} \lim_{M \to \infty} P\left(\bigcap_{n=N}^{M} A_n^c\right) = 0

Borel-Cantelli 引理又称为零一定律,即如果事件发生的概率之和有限,那么事件发生的次数是有限的(有无限次不发生),如果事件发生的概率之和无限,那么事件发生的次数是无限的。

Borel大数定律

假设 (Ω,A,P)(\Omega, A, P) 是一个概率空间,ξk,k1\xi_k, k \geqslant 1 是一列独立同分布随机变量:

P(ξk=1)=p,P(ξk=0)=1p P(\xi_k = 1) = p, \quad P(\xi_k = 0) = 1 - p

Sn=k=1nξkS_n = \sum_{k=1}^{n} \xi_k,那么 Sn/npS_n/n \to p,a.s.

证明:对任意 ϵ>0\epsilon > 0

P(Snnp>ϵ,i.o.)=0 P\left(\left|\frac{S_n}{n} - p\right| > \epsilon, i.o.\right) = 0

由 Borel-Cantelli 引理,只需证明

n=1P(Snnp>ϵ)< \sum_{n=1}^{\infty} P\left(\left|\frac{S_n}{n} - p\right| > \epsilon\right) < \infty

由 Markov 不等式,

P(Snnp>ϵ)ESnnp4n4ϵ4 P\left(\left|\frac{S_n}{n} - p\right| > \epsilon\right) \leqslant \frac{E|S_n - np|^4}{n^4 \epsilon^4}

容易计算得,

ESnnp4=np(1p)[(1p)3+(1p)2]+n(n1)p2(1p)2 E|S_n - np|^4 = np(1-p)[(1-p)^3 + (1-p)^2] + n(n-1)p^2(1-p)^2

因此,

n=1P(Snnp>ϵ)K(ϵ,p)n=11n2< \sum_{n=1}^{\infty} P\left(\left|\frac{S_n}{n} - p\right| > \epsilon\right) \leqslant K(\epsilon, p) \sum_{n=1}^{\infty} \frac{1}{n^2} < \infty

Kolmogorov 大数律

假设 (Ω,A,P)(\Omega, A, P) 是一个概率空间,ξk,k1\xi_k, k \geqslant 1 是一列独立同分布随机变量。如果 Eξk=μE\xi_k = \mu,那么

Snnμ,a.s. \frac{S_n}{n} \to \mu, \quad a.s.
  1. Kolmogorov 强大数律推广了 Borel 强大数律
  2. Kolmogorov 强大数律推广了 Khinchine 大数律