spss27使用教程pdf（spss27使用教程方差分析）

随机区组设计资料的总变异可以分解为处理组间变异、区组间变异和误差三部分。随机区组设计与完全随机设计，由于利用区组控制了可能的混杂因素，并在进行方差分析时，将区组间变异从原组内变异中分离出来，当区组间变异有统计学意义时，由于减少了误差均方使处理间的F值更容易出现显著性，从而提高了实验效率。随机区组设计实际是配对设计的扩展，当K=2时，随机区组设计的方差分析与配对设计的t检验完全等价，即t²=F。

随机区组设计中并没有考察其正态性与方差齐性，是因为无法考察。不管区组变量是否具有统计学意义，都应当保留在方程当中。作为区组变量，应当从设计上考虑与实验因素不存在交互作用，如果不能肯定是否存在交互作用，则应当釆用析因设计、正交设计等更加复杂的统计模型。

关键点：设计分两步，第一步先组成区组；第二步再随机处理组。

举个栗子：

按照一定条件将30只小白鼠分成10个区组，每个区组小白鼠的特征相近，然后，用随机的方法将每个区组内的3只小白鼠分别安排到饲料I、饲料ⅡI和饲料I组。

随机区组设计的方差分析：

SS总=SS组间+SS组内（SS组内=SS区组+SS误差）

相比于完全随机设计，随机区组设计的效率更高，样本量相同时，其处理组间均衡性好于完全随机设计。

在总变异分解中，组间变异的计算与完全随机设计相同，但它分解出了区组的变异，从而使随机误差的变异降低。此时，MS误差往往会减少，统计量F处理一般就会增大，这样就更容易得出多个总体均数差异有统计学意义的推断结果。

因此，随机区组设计方差分析检验效能要高于完全随机设计。

随机区组设计的方差分析属于无重复数据的双向方差分析，two-way ANOVA

分析步骤：

①建立检验假设，确定检验水准

对于处理组：

H0：处理组总体均数相等

H1：处理组总体平均水平不全相等

对于区组：

H0：区组总体均数相等

H1：区组总体均数不全相等

一般地，检验水准为α=0.05

②计算检验统计量

F处理组=MS组间/MS误差

F区组=MS区组/MS误差

③确定P值，做出统计推断

随机区组设计方差分析的适用条件依然是：独立、正态和方差齐。

1.观测指标满足独立性；

2.各组观测指标均来自正态分布总体；

3.各组观测指标方差相等。

在实际中由于方差分析具有稳健性，因此对正态性的条件要求不高，常不关注；随机区组设计，每一个单元只有一个数据，因此软件无法计算方差齐性检验。

随机区组设计中并没有考察其正态性与方差齐性，是因为无法考察。

不管区组变量是否具有统计学意义，都应当保留在方程当中。

作为区组变量，应当从设计上考虑与实验因素不存在交互作用，如果不能肯定是否存在交互作用，则应当采用析因设计、正交设计等更加复杂的统计模型。是否具有统计学意义，都应当保留在方程当中。

分析示例

为探索丹参对肢体缺血再灌注损伤的影响，将30只纯种新西兰实验用大白兔，按窝别相同分为10个区组，每个区组的3只大白兔随机接受三种不同的处理，即在松止血带前分别给予丹参2 ml/kg、丹参1 ml/kg、生理盐水2 ml/kg, 并分别测定松止血带前及松后1小时血中白蛋白含量(g/L), 算出白蛋白的减少量如表所示，问三种处理的效果是否不同?

研究假设

研究问题1:三组大白兔的白蛋白减少量是否相同?

研究问题2:如果总体有差别，那么是哪些组之间出现差别?

数据录入

1. 变量视图

名称b 标签区组

名称 k 标签处理

名称 x 标签白蛋白减少量

2. 数据视图(部分)

操作流程

注意：单变量与多变量区别：① 因变量数=1，选择单变量。② 因变量数≥2，选择多变量。

在随机区组设计中，因为两个因素的不同水平作用下只有一个样本数据，所以无法分析其交互作用，故只能选择主效应。

1.因变量(D): 选入需要分析的因变量(dependent variable),因变量通常指我们所关心的测量变量，如本例当中的白蛋白减少量x。

固定因子(F)和随机因子(A ):两者均指我们的处理因素和区组因素，也就是通常所说的自变量。固定因子(fixed factor)指该因子在样本中所有可能的水平都出现了，即该因子的所有可能水平均列出了，无需进行外推，如本例三种方案处理大白兔，有且只有三种方案，所以属于固定因子。而随机因子(random factor)指该因子的所有可能的水平在样本中没有都出现，需要进行外推，如本例中按窝别分为10个区组，我们认为窝别不止10种，因此属于随机因子。

2.下图为方差分析模型设定部分，又可以分为全模型(full model)和设定模型(specified model), 全模型包括所有自变量的主效应和交互作用，而设定模型则自由设定。在随机区组设计当中需要自己设定模型，模型当中只包括了主效应，即不考虑区组因素和处理因素的交互作用。

3.下图为两两比较的选项，我们只需要对处理因素之间是否存在差异感兴趣，因此在两两比较中选入k, 选用S-N-K法作为两两比较的统计方法。

4.下图表示我们需要获得各种处理的均数和标准差，因此选择描述统计(D)。

结果解释

1.下表给出了处理因素和区组因素的水平和例数，如处理组的水平为1(丹参2 ml/kg) 、 2(丹参1 ml/kg) 、3(生理盐水),各水平的例数均为10;而区组的水平从1到10,各水平的例数均为3。

2.下表给出了各种组合的均数和标准差，我们所关注的是处理因素各水平的均数和标准

差，其具体数值为丹参2 ml/kg(k=1)x±s=2.6±0.52,丹参1 ml/kg(k=2)x±s=3.0±0.40,生理盐水x±s=4.2±0.40。

3.下表为一个典型的方差分析结果表，处理因素(k)方差分析结果F=32.636,P<0.01,可认为三种不同的处理效果不同，即三个总体均数中至少有两个不同。至于三个总体均数中哪些不同，则需要用多个均数间的两两比较方法。区组因素(b) 中 F=0.824,P=0.602>0.05,即不能认为10个区组的总体均数不同。

4.下表对主体间效应的检验作进一步解释，但是对我们来说，意义并不太大。

5.又出现了令人头疼的SNK法两两比较结果，下表在纵向将各组均数按从小到大进行排列，丹参2 ml/kg(k=1) 均数2.5800最小，居于顶端；而生理盐水组(k=3) 均数为4.1700最大，居于底端。而横向则被分成若干亚组，不同亚组间的P<0.05, 而同一亚组间的各组均数 P>0.05, 可见SNK法无法获知准确的P值，只能知道两组比较的P值是否>0.05。本例当中亚组1包括了丹参2 ml/kg(k=1)和丹参1 ml/kg(k=2),因此两组比较的P>0.05,而生理盐水组(k=3)位于亚组2,亚组1和亚组2之间的P>0.05,因此丹参2 ml/kg(k=1)和生理盐水组(k=3)比较P<0.05,丹参1 ml/kg组(k=2)和生理盐水组(k=3)比较P<0.05。

参考：《临床医学研究中的统计分析和图形表达实例详解》

欢迎关注我，让你身边多一位熟悉统计分析方法的帮手，有以下付费视频或服务可供选购：

1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效。

2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑，性价比高。

3.购买视频课程赠送课程相关主题内容1对1答疑1年。

spss27使用教程pdf（spss27使用教程方差分析）

相关推荐