机器学习中的数学——概率论「建议收藏」

机器学习中的数学——概率论「建议收藏」概率论:随机事件、统计量、常见分布、基本定理文章目录1.随机事件2.条件概率1.随机事件在随机试验中,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件2.条件概率假设实验A和B是试验E的事件,考虑A已发生的

机器学习中的数学——概率论「建议收藏」


概率论: 随机事件、统计量、常见分布、基本定理


参考资料:
百度文档

随机变量定义

  1. 若对随机试验的每一种可能结果 ω \omega ω ∈ \in Ω \Omega Ω 都有一个唯一的实数 ξ \xi ξ( ω \omega ω) 与之对应, 则称数值为随机变量. 实际上, 随机变量是将试验的结果映射到实数空间中. 比如男女分别为1, 0.$
  2. 随机变量可以是离散是连续的

随机变量的数字特征 概率分布

分为离散型分布:
p ( x i ) p(x_{i}) p(xi)
连续类型分布:
p ( x ) p(x) p(x)
累计分布函数为:
F ( x ) = ∫ ∞ x p ( ξ ) d ξ F(x)= \int_\infty^x{p(\xi)d\xi} F(x)=xp(ξ)dξ
其积分求和为0.
使用抛硬币来说 p ( 0 ) = 0.5 ; p ( 1 ) = 0.5 p(0)=0.5;p(1)=0.5 p(0)=0.5;p(1)=0.5

随机变量数字特征 期望

数字特征:用以刻画随机变量某方面特征的量,称为随机变量的数字特征

常用的数字特征:数学期望, 方差, 矩, 众数, 中位数, 协方差, 相关系数

离散类型期望:

设离散型随机变量 X X X的概率分布为:
P ( X = x i ) = p i ,     i = 1 , 2 , 3 , . . . . P(X=x_i)=p_i,~~~ i=1, 2, 3,…. P(X=xi)=pi,   i=1,2,3,....
∑ i = 1 ∞ x i p i \sum_{i=1}^\infty{x_ip_i} i=1xipi绝对收敛, 则称 ∑ i = 1 ∞ x i p i \sum_{i=1}^\infty{x_ip_i} i=1xipi为随机变量X的期望或均值, 记为 E X EX EX, 即
E X = ∑ i = 1 ∞ x i p i EX = \sum_{i=1}^\infty{x_ip_i} EX=i=1xipi
注:

  • E X EX EX度量了随机变量X的加权平均
  • p i ( i = 1 , 2 , 3… ) p_i(i=1, 2, 3…) pi(i=1,2,3...)为权重 $

连续型随机变量的期望:

定义:设随机变量X的密度函数为 f ( x ) f(x) f(x), 若 ∫ − ∞ + ∞ x f ( x ) d x \int_{-\infty}^{+\infty}{xf(x)dx} +xf(x)dx绝对收敛, 则称 ∫ − ∞ + ∞ x f ( x ) d x \int_{-\infty}^{+\infty}{xf(x)dx} +xf(x)dx为随机变量 X X X的期望或均值, 记为 E X EX EX.

随机变量函数的数学期望:

定义:设$ X $为随机变量, $ y=g(x) $为实函数

  1. X X X为离散型随机变量, 概率分布为 P ( X = x i ) = p i ,    i = 1 , 2 , 3 , . . . P(X=x_i)=p_i, ~~i=1, 2, 3, … P(X=xi)=pi,  i=1,2,3,...,若 ∑ i = 1 ∞ g ( x ) p i \sum_{i=1}^\infty{g(x)p_i} i=1g(x)pi 绝对收敛, 则 E [ g ( x ) ] E[g(x)] E[g(x)]存在,且
    E [ g ( x ) ] = ∑ i = 1 ∞ g ( x ) p i E[g(x)]=\sum_{i=1}^\infty{g(x)p_i} E[g(x)]=i=1g(x)pi
  2. X X X为连续型随机变量, 密度函数为 f ( x ) f(x) f(x), 若 ∫ − ∞ + ∞ g ( x ) f ( x ) d x \int_{-\infty}^{+\infty}{g(x)f(x)dx} +g(x)f(x)dx绝对收敛, 则 E [ g ( x ) ] E[g(x)] E[g(x)]存在, 且
    E [ g ( x ) ] = ∫ − ∞ + ∞ g ( x ) f ( x ) d x E[g(x)]=\int_{-\infty}^{+\infty}{g(x)f(x)dx} E[g(x)]=+g(x)f(x)dx

例: 设随机变量的概率分布为:

$ X $ 0 1 2
$ P $ 0.1 0.6 0.3

E [ x − E X ] 2 E[x-EX]^2 E[xEX]2 .
解:
E X = 0 ∗ 0.1 + 1 ∗ 0.6 + 2 ∗ 0.3 = 1.2 EX=0*0.1+1*0.6+2*0.3=1.2 EX=00.1+10.6+20.3=1.2
E [ X − E X ] 2 = ( 0 − 1.2 ) 2 × 0.1 + ( 1 − 1.2 ) 2 × 0.6 + ( 2 − 1.2 ) 2 × 0.3 = 0.36 E[X-EX]^2=(0-1.2)^2\times 0.1+(1-1.2)^2\times 0.6+(2-1.2)^2\times 0.3=0.36 E[XEX]2=(01.2)2×0.1+(11.2)2×0.6+(21.2)2×0.3=0.36

随机变量的方差

对随机变量 X X X,知道了它的数学期望 E X EX EX, 虽然对该随机变量有了一定了解, 但还不够.
例: 为评估一批灯泡的好坏, 从某种途径了解到其平均寿命为1000h, 即 E X = 1000 EX=1000 EX=1000, 但不能完全肯定其质量的好坏.

  • 有可能产品的寿命平均集中在950~1050h, 质量稳定!
  • 有可能一半寿命为700小时, 另一半寿命为1300小时, 质量相对不稳定!

故需要找一个值, 能够度量随机变量 X X X E X EX EX的偏离程度.

  • X − E X X-EX XEX—->不能! X − E X X-EX XEX是随机变量
  • E ( X − E X ) E(X-EX) E(XEX)—->不能! E ( X − E X ) = E X − E X = 0 E(X-EX)=EX-EX=0 E(XEX)=EXEX=0(正负偏差相互抵消)
  • E ∣ X − E X ∣ E|X-EX| EXEX—->不便于计算
    得: E ( X − E X ) 2 E(X-EX)^2 E(XEX)2

定义:设随机变量 X X X的数学期望为 E X EX EX, 则称 E ( X − E X ) 2 E(X-EX)^2 E(XEX)2 为随机变量 X X X的方差, 记为 D ( X ) D(X) D(X), 或 V a r ( X ) Var(X) Var(X) ,并称 D ( X ) \sqrt{D(X)} D(X)
X X X的标准差.
方差的计算:
考虑到方差实际上是随机变量函数的数学期望: g ( X ) ( X − E X ) 2 g(X)(X-EX)^2 g(X)(XEX)2, 因此
X X X为离散型随心变量, 概念分布为 p i = P ( X = x i ) ,    i = 1 , 2 , 3… p_i=P(X=x_i), ~~i=1,2,3… pi=P(X=xi),  i=1,2,3...
D ( X ) = E ( X − E X ) 2 = ∑ i = 1 ∞ ( x i − E X ) 2 p i D(X)=E(X-EX)^2=\sum_{i=1}^\infty{(x_i-EX)^2p_i} D(X)=E(XEX)2=i=1(xiEX)2pi
X X X为连续型随机变量, 概率密度为f(x), 则:
D ( X ) = E ( X − E X ) 2 = ∫ − ∞ + ∞ ( x i − E X ) 2 f ( x ) d x D(X)=E(X-EX)^2=\int_{-\infty}^{+\infty}{(x_i-EX)^2f(x)dx} D(X)=E(XEX)2=+(xiEX)2f(x)dx
有如下公式:
D ( X ) = E ( X 2 ) − ( E X ) 2 D(X)=E(X^2)-(EX)^2 D(X)=E(X2)(EX)2
1:

D ( X ) = E ( X − E X ) 2 = E ( X 2 − 2 X ∗ E X + ( E X ) 2 ) D(X)=E(X-EX)^2 = E(X^2 -2X*EX+(EX)^2) D(X)=E(XEX)2=E(X22XEX+(EX)2)
= E ( X 2 ) − 2 ( E X ) 2 + ( E X ) 2 =E(X^2)-2(EX)^2+(EX)^2 =E(X2)2(EX)2+(EX)2
= E ( X 2 ) − ( E X ) 2 =E(X^2)-(EX)^2 =E(X2)(EX)2
方差的性质:

  1. D ( C ) = 0    C 为 常 数 D(C)=0~~C为常数 D(C)=0  C
  2. D ( X + C ) = D ( X ) D(X+C)=D(X) D(X+C)=D(X)
  3. D ( C X ) = C 2 D ( X ) D(CX)=C^2D(X) D(CX)=C2D(X)

协方差

百度百科:协方差

在概率论和统计学中,协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。

C o v ( X , Y ) = E [ ( X − E X ) ( Y − E Y ) ] Cov(X,Y)=E[(X-EX)(Y-EY)] Cov(X,Y)=E[(XEX)(YEY)]
= E ( X Y ) − 2 E ( X ) E ( Y ) + E ( X ) E ( Y ) =E(XY)-2E(X)E(Y)+E(X)E(Y) =E(XY)2E(X)E(Y)+E(X)E(Y)
= E ( X Y ) − E ( X ) E ( Y ) =E(XY)-E(X)E(Y) =E(XY)E(X)E(Y)

从直观上来看,协方差表示的是两个变量总体误差的期望。


  1. 根据【随机变量函数的数学期望】计算。 ↩︎

今天的文章机器学习中的数学——概率论「建议收藏」分享到此就结束了,感谢您的阅读。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/71801.html

(0)
编程小号编程小号

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注