文章目录
引述
在上一节的最后,我们提到了皮尔逊相关系数检验的条件。其中,第一条提到,实验数据通常是成对的来自于正态分布的总体。因此,本节的重点将放在如何对数据进行正态分布检验。
相关的数学基本概念
偏度
峰度
相关MatLab代码
x = normrnd(2, 3, 100, 1); % 生成100*1的随机向量,每个元素是均值为2,标准差为3的正态分布
skewness(x) % 偏度
kurtosis(s) % 峰度
% 将第一行的代码中的100,改成更大的数,例如10000。观察一下,偏度和峰度的大小。
% 数字越大,偏度越接近0,峰度越接近3.
雅克‐贝拉检验(Jarque‐Beratest) (大样本 n>30)
1. JB简介
对于一个随机变量{Xi},假设其偏度为S,峰度为K,那么我们可以构造JB统计量:
可以证明,如果{Xi}是正态分布,那么在大样本情况下JB~X2(2)(自由度为2的卡方分布)【正态分布的偏度为0,峰度为3】
2. 使用假设检验证明该随机变量为正态分布的步骤
- 零假设H0:该随机变量服从正态分布,备择假设H1:该随机变量不服从正态分布;
- 计算该变量的偏度和峰度,代入JB统计量,得到检验值JB*;
- 计算出该检验值对应的p值;
- 若 p < 0.05,拒绝原假设,即该随机变量不服从正态分布;否则,不能拒绝原假设,也就是该随机变量服从正态分布。
3. 使用MATLAB进行JB检验
- 语法
[h, p] = jbtest(x, alpha)
- 输入参数
alpha:显著性水平,一般取 0.05,此时置信水平为 1 – 0.05 = 0.95
x:要检验的随机变量,x必须为向量。 - 输出结果
h = 1,拒绝原假设
h = 0,不能拒绝原假设
%% 正态分布检验
% 检验第一列数据是否为正态分布
% Test是使用的测试数据(被导入的EXCEL文件)
[h, p] = jdtest(Test(:, 1), 0.05)
% 用循环检验所有列的数据
n_c = size(Test, 2); % number of column 数据的列数
H = zeros(1, 6);
P = zeros(1, 6);
for i = 1 : n_c
[h, p] = jdtest(Test(:, i), 0.05);
H(i) = h;
P(i) = p;
end
disp(H)
disp(P)
夏皮洛‐威尔克检验(Shapiro‐wilk)(小样本 3≤n≤50)
1. 使用假设检验证明随机变量符合正态分布的步骤
- 零假设H0:该随机变量符合正态分布;备择假设H1:该随机变量不符合正态分布;
- 计算出威尔克统计量后,得到相应的p值;
- 置信水平为95的前提下,若 p < 0.05,拒绝原假设,否则不能拒绝。
2. SPSS操作步骤
分析 → 描述统计 → 探索 → 点击右侧 图 → 勾选含检验的正态图
Q-Q图(尽可能使用上述的两种检验方式)
1. Q-Q图简介
- 在统计学中,Q-Q图(Q代表分位数Quantile)是一种通过比较两个概率分布的分位数对两个概率分布进行比较的概率图方法。
- 首先选定分位数的对应概率区间集合,在此概率区间上,点(x,y)对应于第一个分布的一个分位数x和第二个分布在和x相同概率区间上相同的分位数。
- 这里,我们选择正态分布和要检验的随机变量,并对其做出Q-Q图,若要检验的随机变量是正态分布,那么Q-Q图就是一条直线。
2.使用MATLAB绘制Q-Q图
要利用Q-Q图鉴别样本数据是否近似于正态分布,只需要看Q-Q图上的点是否近似地在一条直线附近,但是其要求数据量十分巨大!
示例代码:
% 绘制第一列数据的Q-Q图
qqplot(Test(:, 1))
今天的文章相关性分析正态分布检验_正态分布拟合分享到此就结束了,感谢您的阅读。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/68412.html