本博文源于《商务统计》,主要探讨如何理解单因素方差分析。首先可以很确定的说方差分析不是针对方差来做分析。
引例:消费者协会对不同企业的服务水平进行点差,测得23家投诉次数如下:
散点图讲解
- 圆点就是样本投诉服务次数
- X代表行业内的投诉次数的平均值
- 水平虚线代表整体的平均值
- 折线就是将组内平均值连起来
图中的数据在下面每一个都会使用到
方差分析简要介绍
- 检验多个总体均值是否相等
- 研究分类型自变量对数值型因变量的影响
- 方差分析分为单因素方差与双因素方差分析,涉及分类变量数量。单因素只研究一种分类自变量,双因素研究两个分类自变量
题目中的分析目标
分析四个行业的服务质量是否有显著差异,也就是要判断“行业”对投诉次数
是否有显著影响。转化为数学形式就是研究四个行业投诉次数的均值是否相等。
方差分析的相关术语
- 因素或因子:所要检验的对象
- 水平或处理:因子的不同表现
- 观察值:在每个因素水平得到的样本数据
这里:分析行业对投诉次数的影响,行业就是要检验的因子。服务行业的类别就是因子的不同表现。每个行业被投诉的次数就是观察值。
方差分析中误差平方和SS
数据的误差用平方和来表示
- 组内平方和:因素的同一水平下数据误差的平方和
- 组间平方和:因素的不同水平之间数据误差的平方和
方差分析的基本假定
- 每个总体都应服从正态分布
- 各个总体的方差相同
- 观察值是独立的
方差分析假设
H 0 : μ 1 = μ 2 = μ 3 = μ 4 H 1 : μ i ( i = 1 , 2 , 3 , 4 ) 不 全 相 等 H_0:\mu_1=\mu_2=\mu_3=\mu_4\\ H_1:\mu_i(i=1,2,3,4)不全相等 H0:μ1=μ2=μ3=μ4H1:μi(i=1,2,3,4)不全相等
构造检验的统计量
这里就把引例中的散点图具体数据计算完毕,组内平均值和组间平均值都一一计算。
总平方和(波动)SST
X上面两横是样本总平均值,总平方和的含义就是全部观察值与总平均值的离差平方和。
计算引例中的总平方和如下
组件平方和(组间波动)SSA
含义是组内平均值与总平方均值的离差平方和。
组内平方和(组内波动)SSE
组内平方和就是组里的数据与组内均值的离差平方和
三个平方和的关系
SST=SSA+SSE
组内均方与组间均方
组内均方SSA,记为MSA,计算公式
M S A = S S A k − 1 MSA=\frac{SSA}{k-1} MSA=k−1SSA
组间均方SSE,记为MSE,计算公式
M S E = S S E n − k MSE=\frac{SSE}{n-k} MSE=n−kSSE
- n是指的是所有样本的数量,引例中是23
- k就是水平,引例中的行业数4
M S A = 1456.608696 4 − 1 = 485.536232 M S E = 2708 23 − 4 = 142.526314 MSA=\frac{1456.608696}{4-1}=485.536232\\ \\\\\\\\MSE=\frac{2708}{23-4}=142.526314 MSA=4−11456.608696=485.536232MSE=23−42708=142.526314
F统计量
组内均方比上组间均方是服从F分布的,因此F统计量的构建是下面这样子的
F = M S A M S E ∼ F ( k − 1 , n − k ) F=\frac{MSA}{MSE}\sim{F(k-1,n-k)} F=MSEMSA∼F(k−1,n−k)
单因素方差分析表
统计量计算与决策
理论值F cirt>F值,可以拒绝原假设,也可以因为P值足够小可以拒绝原假设
总结
单因素方差分析不是比较方差,而是比较均值是否相等。
今天的文章单因素方差分析解释_单因素和多因素方差分析的区别分享到此就结束了,感谢您的阅读。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/61938.html