概率论基础 - 8 - 大数定理

概率论基础 - 8 - 大数定理概率论历史上第一个极限定理属于伯努利 后人称之为 大数定律

概率论历史上第一个极限定理属于伯努利,后人称之为“大数定律”。概率论中讨论随机变量序列的算术平均值向随机变量各数学期望的算术平均值收敛的定律。

依概率收敛

定义
  • Y 1 , Y 2 , … , Y n , … Y_1,Y_2, \dots ,Y_n, \dots Y1,Y2,,Yn, 是一个随机变量序列, a a a是一个常数。

    若对于任意正数$\varepsilon $有 :

    {%raw%}

lim ⁡ n → ∞ P { ∣ Y n − a ∣ ≤ ε } = 1 \lim _{n \rightarrow \infty} P\left\{\left|Y_{n}-a\right| \leq \varepsilon\right\}=1 nlimP{ Ynaε}=1

​ {%endraw%}

  • 则称序列依概率收敛于 a a a,记作:

Y n → P a Y_{n} \stackrel{P}{\rightarrow} a YnPa

含义
  • 收敛:表明这是一个随机变量序列,而不是某个随机变量;且序列是无限长,而不是有限长。
  • 依概率:表明序列无穷远处的随机变量 Y ∞ Y_{\infty} Y的分布规律为:绝大部分分布于点 a a a,极少数位于 a a a 之外。且分布于 a a a 之外的事件发生的概率之和为0。

大数定理

  • 设随机变量 X 1 , X 2 , … , X n , … X_1,X_2, \dots ,X_n, \dots X1,X2,,Xn, 相互独立,且具有相同的数学期望和方差:

E [ X k ] = μ , Var ⁡ [ X k ] = σ 2 \mathbb{E}\left[X_{k}\right]=\mu, \operatorname{Var}\left[X_{k}\right]=\sigma^{2} E[Xk]=μ,Var[Xk]=σ2

  • 则序列 X i X_i Xi依概率收敛于 μ \mu μ

{%raw%}
lim ⁡ n → ∞ P { ∣ 1 n ∑ i = 1 n X i − E ( X i ) ∣ < ε } = 1 \lim _{n \rightarrow \infty} P\left\{\left|\frac{1}{n} \sum_{i=1}^{n} X_{i}-E\left(X_{i}\right)\right|<\varepsilon\right\}=1 nlimP{ n1i=1nXiE(Xi)<ε}=1
{%endraw%}

  • 这里并没有要求随机变量 X 1 , X 2 , … , X n , … X_1,X_2, \dots ,X_n, \dots X1,X2,,Xn, 同分布。

证明见 切比雪夫不等式

辛钦定理

  • 设随机变量 X 1 , X 2 , … , X n , … X_1,X_2, \dots ,X_n, \dots X1,X2,,Xn, 相互独立,服从同一分布,且具有相同的数学期望 μ \mu μ,则对于任意正数 ε \varepsilon ε有:

{%raw%}
lim ⁡ n → ∞ P { ∣ 1 n ∑ k = 1 n X k − μ ∣ < ε } = 1 \lim _{n \rightarrow \infty} P\left\{\left|\frac{1}{n} \sum_{k=1}^{n} X_{k}-\mu\right|<\varepsilon\right\}=1 nlimP{ n1k=1nXkμ<ε}=1
{%endraw%}

  • 注意:这里并没有要求随机变量 X i X_i Xi的方差存在
证明
  • 由于 X i X_i Xi同分布,他们有相同的分布,也就具有相同的特征函数:

φ X ( t ) = E [ e i t X ] \varphi_{X}(t)=E\left[e^{i t X}\right] φX(t)=E[eitX]

  • 其中 e i t X e^{i t X} eitX为:

e i t X = 1 + i t X 1 − t 2 X 2 2 ! + ⋯ + ( i t ) n X n n ! e^{i t X}=1+\frac{i t X}{1}-\frac{t^{2} X^{2}}{2 !}+\cdots+\frac{(i t)^{n} X^{n}}{n !} eitX=1+1itX2!t2X2++n!(it)nXn

  • 因此 X X X的期望 E ( X ) E(X) E(X)可以用特征函数在 t = 0 t=0 t=0处的一阶导数表示:

{%raw%}
φ X ′ ( 0 ) = i E ( X ) E ( X ) = φ X ′ ( 0 ) i \begin{array}{l} \varphi_{X}'(0)=iE(X)\\ E(X)=\frac{\varphi_{X}'(0)}{i} \end{array} φX(0)=iE(X)E(X)=iφX(0)

{%endraw%}

  • 将特征函数在 t = 0 t=0 t=0处泰勒展开,有:

φ X ( t ) = φ X ( 0 ) + φ X ′ ( 0 ) t + o ( t ) = 1 + i μ t + o ( t ) \varphi_{X}(t)=\varphi_{X}(0)+\varphi_{X}'(0)t+o(t)=1+i\mu t+o(t) φX(t)=φX(0)+φX(0)t+o(t)=1+iμt+o(t)

  • 其中 μ \mu μ= E ( X ) E(X) E(X)
  • 由于 X i X_i Xi相互独立,变量 1 n ∑ k = 1 n X k \frac{1}{n} \sum_{k=1}^{n} X_{k} n1k=1nXk的特征函数为:

{%raw%}
g n ( t ) = E [ e i t 1 n ∑ k = 1 n X k ] = E [ e i t n X 1 ⋅ e i t n X 2 ⋅ ⋯ ⋅ e i t n X n ] = { E [ e i t n X ] } n = [ φ X ( t n ) ] n = [ 1 + i μ t n + o ( t ) ] n \begin{array}{l} {g_n}(t) &= E[{e^{it\frac{1}{n}\sum\limits_{k = 1}^n { {X_k}} }}]\\ &= E[{e^{i\frac{ {\rm{t}}}{n}{X_1}}} \cdot {e^{i\frac{ {\rm{t}}}{n}{X_2}}} \cdot \cdots \cdot {e^{i\frac{ {\rm{t}}}{n}{X_n}}}]\\ &= {\{ E[{e^{i\frac{ {\rm{t}}}{n}X}}]\} ^n}\\ &= {[{\varphi _X}(\frac{t}{n})]^n}\\ &= {[1 + i\mu \frac{t}{n} + o(t)]^n} \end{array} gn(t)=E[eitn1k=1nXk]=E[eintX1eintX2eintXn]={ E[eintX]}n=[φX(nt)]n=[1+iμnt+o(t)]n

{%endraw%}

  • 根据(可由洛必达法则推出):

{%raw%}
lim ⁡ n → ∞ ( 1 + a n ) n = e a \mathop {\lim }\limits_{n \to \infty } {\rm{(1 + }}\frac{ {\rm{a}}}{n}{)^n} = {e^a} nlim(1+na)n=ea

{%endraw%}

  • 得:

g n ( t ) = e i μ t = 1 + i t E ( X ) 1 − t 2 E ( X 2 ) 2 ! + ⋯ + ( i t ) n E ( X n ) n ! {g_n}(t)=e^{i\mu t}=1+\frac{i t E(X)}{1}-\frac{t^{2} E(X^{2})}{2 !}+\cdots+\frac{(i t)^{n} E(X^{n})}{n !} gn(t)=eiμt=1+1itE(X)2!t2E(X2)++n!(it)nE(Xn)

  • e i μ t e^{i\mu t} eiμt为:

e i μ t = 1 + i t μ 1 − t 2 μ 2 2 ! + ⋯ + ( i t ) n μ n n ! e^{i\mu t}=1+\frac{i t \mu}{1}-\frac{t^{2} \mu^{2}}{2 !}+\cdots+\frac{(i t)^{n} \mu^{n}}{n !} eiμt=1+1itμ2!t2μ2++n!(it)nμn

  • X X X n n n阶矩与期望的关系为:

E ( X n ) = μ n E(X^n)=\mu^n E(Xn)=μn

  • 变量 1 n ∑ k = 1 n X k \frac{1}{n} \sum_{k=1}^{n} X_{k} n1k=1nXk与退化函数:

{%raw%}
KaTeX parse error: Unknown column alignment: * at position 32: …{\begin{array}{*̲{20}{c}} {\mu,X…

{%endraw%}

  • 二者具有相同的特征函数,因此具有相同的分布,有:

{%raw%}
lim ⁡ n → ∞ P { ∣ 1 n ∑ k = 1 n X k − μ ∣ < ε } = 1 \lim _{n \rightarrow \infty} P\left\{\left|\frac{1}{n} \sum_{k=1}^{n} X_{k}-\mu\right|<\varepsilon\right\}=1 nlimP{ n1k=1nXkμ<ε}=1

{%endraw%}

伯努利大数定理

  • n A n_A nA n n n次独立重复实验中事件 A A A发生的次数, p p p是事件 A A A在每次试验中发生的概率。则对于任意正数 ε \varepsilon ε有:

{%raw%}
lim ⁡ n → ∞ P { ∣ n A n − p ∣ < ε } = 1  or :  lim ⁡ n → ∞ P { ∣ n A n − p ∣ ≥ ε } = 0 \begin{aligned} & \lim _{n \rightarrow \infty} P\left\{\left|\frac{n_{A}}{n}-p\right|<\varepsilon\right\}=1 \\ \text { or : } & \lim _{n \rightarrow \infty} P\left\{\left|\frac{n_{A}}{n}-p\right| \geq \varepsilon\right\}=0 \end{aligned}  or : nlimP{ nnAp<ε}=1nlimP{ nnApε}=0
{%endraw%}

  • 当独立重复实验执行非常大的次数时,事件 A A A发生的频率逼近于它的概率
  • 伯努利大数定理是亲钦定理的特殊情况

参考资料

  • http://www.huaxiaozhuan.com/%E6%95%B0%E5%AD%A6%E5%9F%BA%E7%A1%80/chapters/2_probability.html
今天的文章 概率论基础 - 8 - 大数定理分享到此就结束了,感谢您的阅读。
编程小号
上一篇 2024-12-12 23:17
下一篇 2024-12-12 23:11

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/bian-cheng-ji-chu/84145.html