spss27使用教程pdf(spss27使用教程方差分析)

spss27使用教程pdf(spss27使用教程方差分析)随机区组设计资料的总变异可以分解为处理组间变异 区组间变异和误差三部分 随机区组设计与完全随机设计 由于利用区组控制了可能的混杂因素 并在进行方差分析时 将区组间变异从原组内变异中分离出来 当区组间变异有统计学意义时 由于减少了误差均方使处理间的 F 值更容易出现显著性 从而提高了实验效率 随机区组设计实际是配对设计的扩展 当 K 2 时 随机区组设计的方差分析与配对设计的 t 检验完全等价 即 t F 随机区组设计中并没有考察其正态性与方差齐性 是因为无法考察 不管区组变量是否具有统计学意义



随机区组设计资料的总变异可以分解为处理组间变异、区组间变异和误差三部分。随机区组设计与完全随机设计,由于利用区组控制了可能的混杂因素,并在进行方差分析时,将区组间变异从原组内变异中分离出来,当区组间变异有统计学意义时,由于减少了误差均方使处理间的F值更容易出现显著性,从而提高了实验效率。随机区组设计实际是配对设计的扩展,当K=2时,随机区组设计的方差分析与配对设计的t检验完全等价,即t²=F。

随机区组设计中并没有考察其正态性与方差齐性,是因为无法考察。不管区组变量是否具有统计学意义,都应当保留在方程当中。作为区组变量,应当从设计上考虑与实验因素不存在交互作用,如果不能肯定是否存在交互作用,则应当釆用析因设计、正交设计等更加复杂的统计模型。

关键点:设计分两步,第一步先组成区组;第二步再随机处理组。

举个栗子:

按照一定条件将30只小白鼠分成10个区组,每个区组小白鼠的特征相近,然后,用随机的方法将每个区组内的3只小白鼠分别安排到饲料I、饲料ⅡI和饲料I组。

随机区组设计的方差分析:

SS总=SS组间+SS组内(SS组内=SS区组+SS误差)

相比于完全随机设计,随机区组设计的效率更高,样本量相同时,其处理组间均衡性好于完全随机设计。

在总变异分解中,组间变异的计算与完全随机设计相同,但它分解出了区组的变异,从而使随机误差的变异降低。此时,MS误差往往会减少,统计量F处理一般就会增大,这样就更容易得出多个总体均数差异有统计学意义的推断结果。

因此,随机区组设计方差分析检验效能要高于完全随机设计。

随机区组设计的方差分析属于无重复数据的双向方差分析,two-way ANOVA

分析步骤:

①建立检验假设,确定检验水准

对于处理组:

H0:处理组总体均数相等

H1:处理组总体平均水平不全相等

对于区组:

H0:区组总体均数相等

H1:区组总体均数不全相等

一般地,检验水准为α=0.05

②计算检验统计量

F处理组=MS组间/MS误差

F区组=MS区组/MS误差

③确定P值,做出统计推断

随机区组设计方差分析的适用条件依然是:独立、正态和方差齐。

1.观测指标满足独立性;

2.各组观测指标均来自正态分布总体;

3.各组观测指标方差相等。

在实际中由于方差分析具有稳健性,因此对正态性的条件要求不高,常不关注;随机区组设计,每一个单元只有一个数据,因此软件无法计算方差齐性检验。

随机区组设计中并没有考察其正态性与方差齐性,是因为无法考察。

不管区组变量是否具有统计学意义,都应当保留在方程当中。

作为区组变量,应当从设计上考虑与实验因素不存在交互作用,如果不能肯定是否存 在交互作用,则应当采用析因设计、正交设计等更加复杂的统计模型。是否具有统计学意义,都应当保留在方程当中。

分析示例

为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新西兰实验用大白兔,按窝别相同分为10个区组,每个区组的3只大白兔随机接受三种不同的处理,即在松止血带前分别给 予丹参2 ml/kg、丹参1 ml/kg、生理盐水2 ml/kg, 并分别测定松止血带前及松后1小时血中白蛋白含量(g/L), 算出白蛋白的减少量如表所示,问三种处理的效果是否不同?

研究假设

研究问题1:三组大白兔的白蛋白减少量是否相同?

研究问题2:如果总体有差别,那么是哪些组之间出现差别?

数据录入

1. 变量视图

名称b 标签 区组

名称 k 标签 处理

名称 x 标签 白蛋白减少量

2. 数据视图(部分)

操作流程

注意:单变量与多变量区别:① 因变量数=1,选择单变量。② 因变量数≥2,选择多变量。

在随机区组设计中,因为两个因素的不同水平作用下只有一个样本数据,所以无法分析其交互作用,故只能选择主效应。

1.因变量(D): 选入需要分析的因变量(dependent variable),因变量通常指我们所关心的 测量变量,如本例当中的白蛋白减少量x。

固定因子(F)和随机因子(A ):两者均指我们的处理因素和区组因素,也就是通常所说的自变量。固定因子(fixed factor)指该因子在样本中所有可能的水平都出现了,即该因子的所有可能水平均列出了,无需进行外推,如本例三种方案处理大白兔,有且只有三种方案,所以属 于固定因子。而随机因子(random factor)指该因子的所有可能的水平在样本中没有都出现, 需要进行外推,如本例中按窝别分为10个区组,我们认为窝别不止10种,因此属于随机因子。

2.下图为方差分析模型设定部分,又可以分为全模型(full model)和设定模型(specified model), 全模型包括所有自变量的主效应和交互作用,而设定模型则自由设定。在随机区组设计当中需要自己设定模型,模型当中只包括了主效应,即不考虑区组因素和处理因素的交互作用。

3.下图为两两比较的选项,我们只需要对处理因素之间是否存在差异感兴趣,因此在两两比较中选入k, 选用S-N-K法作为两两比较的统计方法。

4.下图表示我们需要获得各种处理的均数和标准差,因此选择描述统计(D)。

结果解释

1.下表给出了处理因素和区组因素的水平和例数,如处理组的水平为1(丹参2 ml/kg) 、 2(丹参1 ml/kg) 、3(生理盐水),各水平的例数均为10;而区组的水平从1到10,各水平的例数均为3。

2.下表给出了各种组合的均数和标准差,我们所关注的是处理因素各水平的均数和标准

差,其具体数值为丹参2 ml/kg(k=1)x±s=2.6±0.52,丹参1 ml/kg(k=2)x±s=3.0±0.40,生理盐水x±s=4.2±0.40。

3.下表为一个典型的方差分析结果表,处理因素(k)方差分析结果F=32.636,P<0.01,可认为三种不同的处理效果不同,即三个总体均数中至少有两个不同。至于三个总体均数中哪些不同,则需要用多个均数间的两两比较方法。区组因素(b) 中 F=0.824,P=0.602>0.05,即不能认为10个区组的总体均数不同。

4.下表对主体间效应的检验作进一步解释,但是对我们来说,意义并不太大。

5.又出现了令人头疼的SNK法两两比较结果,下表在纵向将各组均数按从小到大进行排 列,丹参2 ml/kg(k=1) 均数2.5800最小,居于顶端;而生理盐水组(k=3) 均数为4.1700最大,居于底端。而横向则被分成若干亚组,不同亚组间的P<0.05, 而同一亚组间的各组均数 P>0.05, 可见SNK法无法获知准确的P值,只能知道两组比较的P值是否>0.05。本例当中亚组1包括了丹参2 ml/kg(k=1)和丹参1 ml/kg(k=2),因此两组比较的P>0.05,而生理盐水组(k=3)位于亚组2,亚组1和亚组2之间的P>0.05,因此丹参2 ml/kg(k=1)和生理盐水组(k=3)比较P<0.05,丹参1 ml/kg组(k=2)和生理盐水组(k=3)比较P<0.05。

参考:《临床医学研究中的统计分析和图形表达实例详解》

欢迎关注我,让你身边多一位熟悉统计分析方法的帮手,有以下付费视频或服务可供选购:

1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效。

2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑,性价比高。

3.购买视频课程赠送课程相关主题内容1对1答疑1年。

编程小号
上一篇 2025-02-13 22:33
下一篇 2025-03-29 13:40

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/bian-cheng-ri-ji/58541.html