偏度(skewness)
是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数值特征:定义为:样本的三阶标准化矩。
S k e w ( X ) = E [ ( X − μ σ ) ] = k 3 σ 3 = k 3 k 2 3 / 2 Skew(X)=E[(\frac{X-\mu}{\sigma})]=\frac{k_3}{\sigma_3}=\frac{k_3}{k_2^{3/2}} Skew(X)=E[(σX−μ)]=σ3k3=k23/2k3
偏度定义中包括:正态分布(偏度=0)、右偏(尾巴右偏)分布(也叫正偏分布,偏度>0),左偏(尾巴左偏)分布(也叫负偏分布,其偏度<0)。
峰度(peakedness、kurtosis)
又称峰态系数。表征概率密度分布曲线在平均值处峰值高低的特征数,直观看来,峰度反映了峰部的尖度,随机变量的峰度计算方法:随机变量的四阶中心距与方差平方的比值。
K u r t ( X ) = E [ ( X − μ σ ) 4 ] = E [ ( X − μ ) 4 ] E [ ( X − μ ) 2 ] ) 2 Kurt(X)=E[(\frac{X-\mu}{\sigma})^4]=\frac{E[(X-\mu)^4]}{E[(X-\mu)^2])^2} Kurt(X)=E[(σX−μ)4]=E[(X−μ)2])2E[(X−μ)4]
峰度包括正态分布(峰度值=3),厚尾(峰度值>3),瘦尾(峰度值<3)
具体计算方法:
DataFrame.skew()
DtaFrame.kurt()
今天的文章数据分布偏度与峰态_峰度系数和偏度系数判断分布分享到此就结束了,感谢您的阅读。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/84875.html