方差分析ANOVA 助教李婕2003 年11 月21 日已经学过的知识一位研究者对长子与次子的心理特征感兴趣。他在一年级大学生中随机抽取了10 个长子和20 个非长子对其施测自尊量表。10 个长子在量表上的平均分是X = 48 ,SS=670 。20 个非长子的平均分是X = 41 ,SS=1010 。这些数据表明两组间是否有显著差异?用α= .01 的显著性水平作假设检验。一个新的情境一位研究者感兴趣影响儿童阅读能力的因素.研究者认为儿童的年龄和每次阅读时间可能是重要的影响因素。研究者设计了以下实验:选取三个年龄组的儿童: 3 岁, 8 岁, 和14 岁.将每个年龄组的儿童随机分配到三个阅读条件. 组1 阅读时间为5 分钟; 组2 为15 分钟; 对于组3 为30 分钟.两个星期之后测试了这些儿童的阅读能力。分析t- 检验和z- 检验不能用于多于2 组的数据. 处理这类数据需要用一种新的推论统计程序: 方差分析(ANOVA). ( 为什么) 这次课的内容最基本的ANOVA. 集中讨论单因素, 独立测量的研究设计. 1. ANOVA 的简介2. ANOVA 的逻辑3. ANOVA 的符号. 4. ANOVA 的过程和例题5. 事后检验ANOVA 简介(1)方差分析即analysis of variance ,简称ANOVA 。功能:分析实验数据中不同来源的变异对总变异的贡献大小,确定实验中的自变量是否对因变量有重要影响。方差的来源什么造成样本的不同(处理间变异) 处理/组效应- 处理造成的差异个体差异效应- 个体差异变异随机误差每一个样本内部的变异( 处理内变异) 个体差异效应 随机误差ANOVA 简介(2)在方差分析中, 自变量称为因素. 包含一个自变量的研究称为单因素设计(single-factor design ). 具有多于一个自变量研究称为因素设计(factorial design ). 构成因素的个别处理条件称为因素的水平ANOVA 简介(3)ANOVA 能够处理数据的类型:两个自变量( 称为因素): 年龄和阅读时间,都是组间( 独立样本) 变量. 包含组内( 重复测量) 因素的研究设计同时包含组间和组内因素的混合设计(e.g. 假设上例中我们用同一些儿童作纵向研究。年龄是组内变量,阅读时间是组间变量). 上述研究称为因素设计, 两个组间因素,每一个因素有3 个水平( 称为3 X 3 组间设计). ANOVA 逻辑与假设检验的逻辑是同样的, 只是具体内容有变化step 1: 陈述H0 ( 和H1) ,确定标准: a = ?step 2: ANOVA 检验总是单尾(不同之处)step 3: 指出检验的df ( 有两个df) step 4: 查表找出临界F 统计量step 5: 对于样本,计算F 统计量step 6: 比较F 统计量和临界F 统计量step 7: 对于H0 作出结论单因素, 独立测量研究设计的例子检验三个不同的学习方法的效应。将学生随机分配到3个处理组方法A :让学生只读课本, 不去上课. 方法B :上课,记笔记,不读课本. 方法C :不读课本,不去上课, 只看别人的笔记单因素, 独立测量研究设计的例子Step 1: 陈述假设和设定标准( 选择a) H0: m1 = m2 = m3 H1: 其中一个组与另一个(或更多)的组均值不同。备择假设可能的形式很多:m1 不等于m2 = m3 m1 = m3 不等于m2 m1 = m2 不等于m3 m1 不等于m2 不等于m3 因此,只需给出虚无假设就够了单因素, 独立测量研究设计的例子step 2: ANOVA 检验总是单尾. 因为不存在负的方差. F 分布表也只有单侧的Alpha. (F分布图)step 3: 找出检验的df. 注意要考虑几个df step 4: 从表找出临界F 统计量step 5: 计算样本的F统计量观测值step 6: 比较F 统计量的观测值与临界F 统计量如果F 统计量的观测值(Fobs) 在统计上显著地大于1.0 则拒绝H0 单因素, 独立测量研究设计的例子F< 或=1, 即MS 组间/ MSw 组内<1 ,说明数据的总变异由分组不同造成的变异只占很小的部分,大部分是由试验误差何个体差异所致,就是说不同的实验处理之间变异不大,或者说试验处理基本无效。F>1 而且落入F分布的临界区,说明实验数据的变异由不同的实验处理所造成,即不同的试验处理之间有差异。ANOVA 的专用符号 K = 处理条件(或组)的数目n = 每一个组的数目(如果它们相等) ni = 第i组的数目(如果它们不等) N = Sni = 总的样本容量Ti = SXij G = SXij = 总的和G-bar = G / N = 总的均值 SSi = 每一个组的和方= S(Xij - i)2 SX2=106G=30= 总的和N=15= 总的样本容量G-bar=30/15=2= 总的均值K = 3 = 处理条件( 或组) ANOVA 的过程F比率= 处理间方差/ 处理内方差( 需要找出两个方差. ) 最基本公式s2 = SS/df. SS 和= SX2 - (G2/N) SS 和= 106 - (302/15) =106 - 60 = 46 需要将其分解为组间变异和组内变异. SS 和= SS 组间+ SS 组内如何得到SS 组内? 将每一个组SS 相加SSwithin = SSS 每一个处理内部= SSSi= 6 + 6 + 4 = 16 如何得到SS 组间? 快捷的方法是: SS 和- SS 组内注意不推荐用这种方法, 因为: 无法检查计算错误未涉及SS 组间是如何组成. 直接计算SS 组间的两个公式: 定义公式和计算公式 定义公式:SS 间= S[ni( X-bar- G-bar)2] = 5(1 - 2) 2 + 5(4 - 2) 2 + 5(1 - 2)2 = 5 + 20 + 5 = 30 计算公式:SS 间= S(T2/ni) - G2/N = 52/5 + 202/5 + 52/5 - 302/15 = 5 + 80 + 5 - 60 = 30 SS 和= SS 组间+ SS 组内= 16 + 30 = 46 s2 = SS/df. df 共有两个( 或三个) 自由度, 一个组间方差df, 一个组内方差df ( 以及一个总的df). df 和= N - 1 df 组内= = N - K df 组间= K - 1 df 和= df 组内+ df 组间df 在例子中: df 组内= 15 - 3 = 12 df 组间= 3 - 1 = 2 df 和= 15 - 1 = 14, = 12 + 2 均方:计算方差. 方差= 均方= MS = SS/df MS 组间= SS 组间/df 组间--> 上例中= 30/2 = 15 MS 组内=误差的均方= SS 组内/df 组内--> 上例中= 16/12 = 1.33 F比率F比率= 处理间方差/处理内方差= MS 组间/ MSw 组间上例中的F比率是: 15/1.33 = 11.28 查F 表确定Fcrit 对假设作出结论df 组间= 分子的dfdf 组内= 分母的df ( 误差) --> 上例中: df 组内= 12; df 组间= 2 如果选择a = .05, Fcrit = 3.88 如果选择a = .01, Fcrit = 6.93 F 比率的观测值11.28> Fcrit., 所以拒绝H0 (m1 = m2 = m3). 报告结果F(df 组间,df 组内) = Fobs, p < ? 报告结果单因素方差分析发现学习方法有显著的效应, F(2,12) = 11.28, p < 0.01. 事后检验(Post hoc tests)1 ANOVA 的结果是检验H0: m1 = m2 = m3 , 并未提供哪个备择假设得到支持. 也就是说, 只知道一些组与其它组不同, 但并知道差别在哪些组之间. 所以从ANOVA 得到显著差异的结果( 拒绝H0) 后,一定要做作事后检验. 事后检验使我们能够比较各组, 发现差异产生在什么地方. 事后检验就是比较每一个处理组与另一个处理组, 一次比较两个. 这称为成对比较. 事后检验(Post hoc tests)2 在上例中, 可以比较m1 与m2, m1 与m3, 以及m2 与m3. 这样的做法有没有问题?每一个比较都是一个单独的假设检验, 每一个都有犯I类错误的风险. 所以,比较对数越多, 作结论的风险越大。即容易发现实际不存在的差异。这称为实验导致的(experimentwise )alpha 水平( 或族系(familywise )误差) 事后检验(Post hoc tests)3 αEW = 1 - (1 - a)c c = 比较对数对于上述例子, 如果选择a = 0.05 作3 对比较αEW = 1 - (1 - a)c = 1 - (.95)3 = 1 - .857 = .143 I 类错误的机会增加到14.7% 而不再是5% ,多数事后检验设计中都控制了实验导致误差. 事后检验(Post hoc tests)4 介绍两个事后检验: Tukey's HSD 检验(honestly 差异显著性) 检验和Scheff 检验. a) Tukey's HSD 检验可以计算出单一的值确定处理均值间的最小差异,考查此差异在统计上是否显著. 此检验要求各组有相等的样本容量. HSD = q * sqrt (MS 组内/n )q 值可以从表中查出(附表6). 需要用到K和df 组内, 以及αEW 举例在上例中( 用αEW = .05): HSD = q * sqrt (MS 组内/n )=(3.77) sqrt (1.33/5 )= (3.77)(.516) = 1.94 比较1: H0: m1 = m2 2 -1 = 4.0 - 1.0 = 3.0 HSD = 1.94 < 3.0 ,拒绝H0 比较2: H0: m1 = m3 3 -1 = 1.0 - 1.0 = 0.0 HSD = 1.94 > 0.0 ,不能拒绝H0 比较3: H0: m2 = m3 2 -3 = 4.0 - 1.0 = 3.0 HSD = 1.94 < 3.0 ,拒绝H0 所以B 与A 和C 不同,而A 与C 没有差异b) Scheff 检验用F比率检验差异. 这是最保守的检验( 降低I 类错误的风险, 但增加II 类错误的风险). 特别适用于n 不等的情况重新计算MS 组间, 每次只检验一个比较.注意:用整体的df 组间和整体的MS 组内. 举例:比较1 H0: m1 = m2 SS 组间== 52/5+202/5-252/10 = 22.5 MS 组间= = 22.5/2 = 11.25 MS 组内= = 16/12 = 1.33 F 比率= MS 间/MS 组内= 11.25/1.33 = 8.46 查F 表. a = .05, Fcrit(2,12) = 3.88 8.46 > 3.88, 拒绝H0 举例:比较2 H0: m1 = m3 SS 组间== 52/5+52/5-102/10= 0 MS 组间=0/2 = 0 MS 组内=16/12 = 1.33 F 比率= MS 间/MS 组内= 0/1.33 = 0 查F 表. a = .05, Fcrit(2,12) = 3.88 0 < 3.88, 不能拒绝H0 举例:比较3 H0: m2 = m3 SS 组间==52/5+202/5-252/10 = 22.5 MS 组间=22.5/2 = 11.25 MS 组内=16/12 = 1.33 F 比率= MS 间/MS 组内= 11.25/1.33 = 8.46 查F 表. a = .05, Fcrit(2,12) = 3.88 8.46 > 3.88, 拒绝H0 与t- 检验的关系差异间独立样本t- 检验与两个水平的单因素组间ANOVA 有何区别? 没有. F 比率= t2 差异间t- 检验和ANOVA, t- 检验是考察两个均值间的差异ANOVA 是考察方差. 如果只有两个组, t 统计量的平方就是F 统计量. 练习题一位研究者研究三种键盘设计。记录了三组被试的错误次数:键盘A :0 4 0 1 0 键盘B :6 8 5 4 2 键盘C: 6 5 9 4 6 键盘类型对打字错误有无显著的影响?* * 阅读时间5 分钟15 分钟30 分钟年龄3 岁8 岁14 岁3*3 个共9个单元格,如何分析数据?1 = 1 2 = 4 3 = 1 研究方法方法A 只读课本方法B 只作笔记方法C 借别人笔记0 4 1 1 3 2 3 6 2 1 3 0 0 4 0 T1 = 5 T2 = 20 T3 = 5 SS1 = 6 SS2 = 6 SS3 = 4 n1 = 5 n2 = 5 n3 = 5
下载此电子书资料需要扣除0点,