概率论: 随机事件、统计量、常见分布、基本定理
参考资料:
百度文档
随机变量定义
- 若对随机试验的每一种可能结果 ω \omega ω ∈ \in ∈ Ω \Omega Ω 都有一个唯一的实数 ξ \xi ξ( ω \omega ω) 与之对应, 则称数值为随机变量. 实际上, 随机变量是将试验的结果映射到实数空间中. 比如男女分别为1, 0.$
- 随机变量可以是离散是连续的
随机变量的数字特征 概率分布
分为离散型分布:
p ( x i ) p(x_{i}) p(xi)
连续类型分布:
p ( x ) p(x) p(x)
累计分布函数为:
F ( x ) = ∫ ∞ x p ( ξ ) d ξ F(x)= \int_\infty^x{p(\xi)d\xi} F(x)=∫∞xp(ξ)dξ
其积分求和为0.
使用抛硬币来说 p ( 0 ) = 0.5 ; p ( 1 ) = 0.5 p(0)=0.5;p(1)=0.5 p(0)=0.5;p(1)=0.5
随机变量数字特征 期望
数字特征:用以刻画随机变量某方面特征的量,称为随机变量的数字特征
常用的数字特征:数学期望, 方差, 矩, 众数, 中位数, 协方差, 相关系数
离散类型期望:
设离散型随机变量 X X X的概率分布为:
P ( X = x i ) = p i , i = 1 , 2 , 3 , . . . . P(X=x_i)=p_i,~~~ i=1, 2, 3,…. P(X=xi)=pi, i=1,2,3,....
若 ∑ i = 1 ∞ x i p i \sum_{i=1}^\infty{x_ip_i} ∑i=1∞xipi绝对收敛, 则称 ∑ i = 1 ∞ x i p i \sum_{i=1}^\infty{x_ip_i} ∑i=1∞xipi为随机变量X的期望或均值, 记为 E X EX EX, 即
E X = ∑ i = 1 ∞ x i p i EX = \sum_{i=1}^\infty{x_ip_i} EX=i=1∑∞xipi
注:
- E X EX EX度量了随机变量X的加权平均
- p i ( i = 1 , 2 , 3… ) p_i(i=1, 2, 3…) pi(i=1,2,3...)为权重 $
连续型随机变量的期望:
定义:设随机变量X的密度函数为 f ( x ) f(x) f(x), 若 ∫ − ∞ + ∞ x f ( x ) d x \int_{-\infty}^{+\infty}{xf(x)dx} ∫−∞+∞xf(x)dx绝对收敛, 则称 ∫ − ∞ + ∞ x f ( x ) d x \int_{-\infty}^{+\infty}{xf(x)dx} ∫−∞+∞xf(x)dx为随机变量 X X X的期望或均值, 记为 E X EX EX.
随机变量函数的数学期望:
定义:设$ X $为随机变量, $ y=g(x) $为实函数
- 设 X X X为离散型随机变量, 概率分布为 P ( X = x i ) = p i , i = 1 , 2 , 3 , . . . P(X=x_i)=p_i, ~~i=1, 2, 3, … P(X=xi)=pi, i=1,2,3,...,若 ∑ i = 1 ∞ g ( x ) p i \sum_{i=1}^\infty{g(x)p_i} ∑i=1∞g(x)pi 绝对收敛, 则 E [ g ( x ) ] E[g(x)] E[g(x)]存在,且
E [ g ( x ) ] = ∑ i = 1 ∞ g ( x ) p i E[g(x)]=\sum_{i=1}^\infty{g(x)p_i} E[g(x)]=i=1∑∞g(x)pi - 设 X X X为连续型随机变量, 密度函数为 f ( x ) f(x) f(x), 若 ∫ − ∞ + ∞ g ( x ) f ( x ) d x \int_{-\infty}^{+\infty}{g(x)f(x)dx} ∫−∞+∞g(x)f(x)dx绝对收敛, 则 E [ g ( x ) ] E[g(x)] E[g(x)]存在, 且
E [ g ( x ) ] = ∫ − ∞ + ∞ g ( x ) f ( x ) d x E[g(x)]=\int_{-\infty}^{+\infty}{g(x)f(x)dx} E[g(x)]=∫−∞+∞g(x)f(x)dx
例: 设随机变量的概率分布为:
$ X $ | 0 | 1 | 2 |
---|---|---|---|
$ P $ | 0.1 | 0.6 | 0.3 |
求 E [ x − E X ] 2 E[x-EX]^2 E[x−EX]2 .
解:
E X = 0 ∗ 0.1 + 1 ∗ 0.6 + 2 ∗ 0.3 = 1.2 EX=0*0.1+1*0.6+2*0.3=1.2 EX=0∗0.1+1∗0.6+2∗0.3=1.2
E [ X − E X ] 2 = ( 0 − 1.2 ) 2 × 0.1 + ( 1 − 1.2 ) 2 × 0.6 + ( 2 − 1.2 ) 2 × 0.3 = 0.36 E[X-EX]^2=(0-1.2)^2\times 0.1+(1-1.2)^2\times 0.6+(2-1.2)^2\times 0.3=0.36 E[X−EX]2=(0−1.2)2×0.1+(1−1.2)2×0.6+(2−1.2)2×0.3=0.36
随机变量的方差
对随机变量 X X X,知道了它的数学期望 E X EX EX, 虽然对该随机变量有了一定了解, 但还不够.
例: 为评估一批灯泡的好坏, 从某种途径了解到其平均寿命为1000h, 即 E X = 1000 EX=1000 EX=1000, 但不能完全肯定其质量的好坏.
- 有可能产品的寿命平均集中在950~1050h, 质量稳定!
- 有可能一半寿命为700小时, 另一半寿命为1300小时, 质量相对不稳定!
故需要找一个值, 能够度量随机变量 X X X与 E X EX EX的偏离程度.
- X − E X X-EX X−EX—->不能! X − E X X-EX X−EX是随机变量
- E ( X − E X ) E(X-EX) E(X−EX)—->不能! E ( X − E X ) = E X − E X = 0 E(X-EX)=EX-EX=0 E(X−EX)=EX−EX=0(正负偏差相互抵消)
- E ∣ X − E X ∣ E|X-EX| E∣X−EX∣—->不便于计算
得: E ( X − E X ) 2 E(X-EX)^2 E(X−EX)2
定义:设随机变量 X X X的数学期望为 E X EX EX, 则称 E ( X − E X ) 2 E(X-EX)^2 E(X−EX)2 为随机变量 X X X的方差, 记为 D ( X ) D(X) D(X), 或 V a r ( X ) Var(X) Var(X) ,并称 D ( X ) \sqrt{D(X)} D(X)为 X X X的标准差.
方差的计算:
考虑到方差实际上是随机变量函数的数学期望: g ( X ) ( X − E X ) 2 g(X)(X-EX)^2 g(X)(X−EX)2, 因此
若 X X X为离散型随心变量, 概念分布为 p i = P ( X = x i ) , i = 1 , 2 , 3… p_i=P(X=x_i), ~~i=1,2,3… pi=P(X=xi), i=1,2,3...则
D ( X ) = E ( X − E X ) 2 = ∑ i = 1 ∞ ( x i − E X ) 2 p i D(X)=E(X-EX)^2=\sum_{i=1}^\infty{(x_i-EX)^2p_i} D(X)=E(X−EX)2=i=1∑∞(xi−EX)2pi
若 X X X为连续型随机变量, 概率密度为f(x), 则:
D ( X ) = E ( X − E X ) 2 = ∫ − ∞ + ∞ ( x i − E X ) 2 f ( x ) d x D(X)=E(X-EX)^2=\int_{-\infty}^{+\infty}{(x_i-EX)^2f(x)dx} D(X)=E(X−EX)2=∫−∞+∞(xi−EX)2f(x)dx
有如下公式:
D ( X ) = E ( X 2 ) − ( E X ) 2 D(X)=E(X^2)-(EX)^2 D(X)=E(X2)−(EX)2
证1:
D ( X ) = E ( X − E X ) 2 = E ( X 2 − 2 X ∗ E X + ( E X ) 2 ) D(X)=E(X-EX)^2 = E(X^2 -2X*EX+(EX)^2) D(X)=E(X−EX)2=E(X2−2X∗EX+(EX)2)
= E ( X 2 ) − 2 ( E X ) 2 + ( E X ) 2 =E(X^2)-2(EX)^2+(EX)^2 =E(X2)−2(EX)2+(EX)2
= E ( X 2 ) − ( E X ) 2 =E(X^2)-(EX)^2 =E(X2)−(EX)2
方差的性质:
- D ( C ) = 0 C 为 常 数 D(C)=0~~C为常数 D(C)=0 C为常数
- D ( X + C ) = D ( X ) D(X+C)=D(X) D(X+C)=D(X)
- D ( C X ) = C 2 D ( X ) D(CX)=C^2D(X) D(CX)=C2D(X)
协方差
百度百科:协方差
在概率论和统计学中,协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。
C o v ( X , Y ) = E [ ( X − E X ) ( Y − E Y ) ] Cov(X,Y)=E[(X-EX)(Y-EY)] Cov(X,Y)=E[(X−EX)(Y−EY)]
= E ( X Y ) − 2 E ( X ) E ( Y ) + E ( X ) E ( Y ) =E(XY)-2E(X)E(Y)+E(X)E(Y) =E(XY)−2E(X)E(Y)+E(X)E(Y)
= E ( X Y ) − E ( X ) E ( Y ) =E(XY)-E(X)E(Y) =E(XY)−E(X)E(Y)
从直观上来看,协方差表示的是两个变量总体误差的期望。
-
根据【随机变量函数的数学期望】计算。 ↩︎
今天的文章机器学习中的数学——概率论「建议收藏」分享到此就结束了,感谢您的阅读。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/71801.html