平均数差异显著性检验统计检验力和效果大小的估计原理与方法.docx
第 30卷总第 115期心理学探新PSYCHOLO G ICAL EXPLORA T ION2021年第 1期平均数差异显著性检验统计检验力和效果大小的估计原理与方法胡竹菁江西师范大学 心理学院 ,南昌 330022 摘 要 该文以平均数差异显著性检验为例 ,对实验数据进行假设检验后 ,继续对其统计检验力和效果大小进行估计的根本原理和方法作一介绍 。关键词 平均数差异显著性检验 ;假设检验 ;统计检验力 ;效果大小文章编号 1003 - 5184 2021 01 - 0068 - 06中图分类号 B841. 2文献标识码 A 1 。在我国现有的心理或1 引言在心理学研究中 ,应用 Z检验 、t检验 、F检验或 卡方检验等推断统计方法会得到对某种类型的样本统计量 如样本平均数 、方差 、相关系数 、比率或实计数等 的几个样本统计量之间的差异是否显著的 假设检验结果 ,但是 ,假设检验结果并不能有助于了解它们之间的差异到底有多大 ,其差异显著性有多 重要 。因此 ,现代心理统计学的开展要求通过计算统计检验力 或效果大小 来到达这些目的 。当今 国内外心理与教育统计学最重要的开展趋势之一是有关“统 计 检 验 力 powe r of te st 和 效 果 大 小 effec t size 的计算方法问题越来越重要了 。随着 心理学科的开展 ,目前美国心理学会的学术期刊已经明确要求研究者在投稿时需要在文章中提供有关 “统计力 和“效果大小 等方面的数据 。例如 ,美国心理协会最新版 第 5 版 的写作手册 一书中 ,明确要求 “作者对于自己的研究假设进行检验时 ,必须考虑采取严格的统计力 sta tistic s powe r 。我 们可以通过特定的 水平 、效果大小和样本大小来 决定统计力 ,而这关系到正确地拒绝作者想要检验hen的 d 值和 k 值教育统计教材中 , 比拟重视如何控制 型错误的问题 , 对于如何计算和控制 型错误并由此提高统计 检验力问题那么较少介绍 2 - 5 。鉴于目前国外较为著名的心理统计学教材 6 - 9 都重视统计检验力和效果 大小的估计原理与估计方法 , 文章拟以平均数差异显著性检验为例 , 对实验数据进行假设检验后 , 继续 对其统计检验力和效果大小进行估计的根本原理和方法进行介绍 。2 统计检验力的含义与估计原理对平均数进行差异显著性检验时 , 通常将检验 的虚无假设设为 H0 1 0 , 或 1 - 0 0, 这是假设 1 与 0 在统计学意义上 , 两个平均数之间实质上是没有 显 著 差 异 的 ; 而 将 虚 无 假 设 的 反 面 设 为H1 1 0 , 这是假设 1 与 0 在统计学意义上 , 两 个平均数之间实质上是有显著差异的 。根据假设检验的结果 , 无论是拒绝或者不拒绝虚无假设 , 都有可能或者犯 错误或者犯 错误 。通常情况下 和 不可能同时增大或减小 , 和 的相互关系通常有 如表 1 和图 1所示 。表 1 假设检验的各种可能结果的假设的可能性为了让读者能够充分地了解到你的研究发现的重要性 ,在你的结果段落中呈现效果大小 effec t size 的索引或关系强度 strength of a re la tion sh ip 是必要的 。你可以使用一些一般效果大小的估计值来估计你研究结果的效果大小或关接受 H0拒绝 H0正确决策 , 概率 1 - 置信度第二类错误 ,概率 第一类错误 , 概率 检验水平正确决策 , 概率 1 - 统计检验力H0 为真H0 为假系强度 ,包括 但不是受限于 2 , 2 , 2Co2图 1 和 关系示意图当 虚 无 假 设 是 H0 1 0 时 , 虚 无 假 设 分 布 nu ll hypo the sis d istribu tion, NHD 是以零为中心的 正态分布 , 以对平均数的检验为例 , 所谓虚无 假设 分备择假设的分布中 , 大于这个 Z 统计量的备择假设的数量与小于这个 Z 统计量的备择假设的数量各 占 50 , 由此来对可能犯 型错误的概率进行近似 的估计 。由于 是表示某种特殊的备择假设分布的平均Z 值 , 因此它的计算方法也与 Z 值的计算方法密切 关联 。由于在估计 值时 , 一方面假定备择假设的 分布是正态分布 , 另一方面也用一次抽样中所获得 的假设检验的 Z 统计量来作为 值 , 因此 , 两个独立 样本平均数差异显著性检验的 值的计算方法将以 以下公式 1所示的 计算 Z 统计量的公式为根底 。布 , 就是指当虚无假设 H0 为真时 , X - 0 或 X1 - X2的分布 。由于可以通过预先设定 水平的 方式 来 控制当虚无假设为真时拒绝它可能 会犯 错 误的 概率 。因此 , 在此根底上得到的虚无假设差异显著性检验的 Z 统计量分布 或 t统计量分布 在置信度 范围内也是 以零 为 中心 的分 布 a cen tra l Z o r td istribu tion 。由表 1可知 , 当虚无假设 H0 为假 备择假设 H1 为真 时 , 接受 H0 就会犯 型错误 ; 拒绝 H0 , 那么是做 出了正确的决策 , 其概率等于 1 - 。换言之 , 当 H1 为真 , 即 1 与 0 确实有差异时 ,1 与 0 的距离即 表示 1 与 0 的真实差异 , 以 1 - 的概率接受 H1 。1 - 反映着正确识别真实差异的能力 , 统计学中称 之为统计检验力 powe r of te st 或效力 。也可以把统计检验力 1 - 定义为 “在虚无假设 H0 为假 备择假设 H1 为真 时 , 正确拒绝 H0 的概率 。 如果想要知道犯 型错误的概率是多少 , 就要知道备择假设的分布情况 a lte rna tive hypo the sis d is2tribu tion, AHD , 以 对平 均 数差 异显 著性 的 检验 为 例 , 所谓备 择 假 设 分 布 , 就 是 指 当 虚 无 假 设 H0 为 X1 - X2 - 1 - 2 Z 公式 1 2 21 2n1 n2如前所述 , 在两个独立样本平均数差异显著性 检验中 ,是表示某种特殊的备择假设分布的期望Z 值 在 t检验中就是期望 t值 , 而样本平均数 X1的期望值是 1 , 样本平均数 X2 的期望值是2 , 与此相应 , 计算两个独立样本平均数差异显著性检验的值的公式有如以下公式 2 所示 。 -1 2公式 2 2 21 2n1n2例如 , 当对两个实验分组的实验数据进行平均 数差异显著性检验时 , 如果用公式 1 计算的平均数 差异显著性检验统计量为 Z 3. 0, 那么就可以 把“Z 3. 0 视为是公式 2 所得到的“值 的计算结果 , 并且把“所有可能的备择假设的分布 假设为是 以 3. 0 为中心的正态分布 , 这时 , 这次抽样检验结果Z 3. 0就被视为该次实验中备择假设分布的期望值 , 这有如图 2所示 。假 , 而备择假设 H1 为 真 时 , X - 0 或 X1 - X2 的 分布 。遗憾的是 , 由于与虚无假设相对立的备择假设H1 1 0 是虚无假设 H0 1 0 的补集 , 两个平 均数之间不相等的值几乎是无限多的 , 因此 , 它们之间的差值到底是多少是不确定的 。在理论上 , 备择 假设 H1 1 0 的分布值是一个不是以零为中心的分布 a noncen tra l Z o r t d istribu tion , 它是以什么 值为中心也有着无数多个选择 , 因此 , 一般情况下 ,难以对 值或 1 - 值作出准确的估计 。另一方面 ,从总体上说 , 对统计检验力的分析是 一个近 似 值 的 分 析 , 因 此 可 以 假 设 备 择 假 设 分 布AHD 是一种正态分布 ,在此根底上得到的备择假设差异显著性检验的 Z 统计量分布 或 t统计量分布 也是正态分布 。如果能找到某种备择假设分布的集 中值 ,就能对 或 1 - 值作出某种近似的估计 。虽然在一般情况下由于不知道备择假设分布是 怎样的而无法精确计算 型错误的值 , 但在以进行 平均数差异检验为目的的抽样实验中总会得到一个 Z 或 t统计量 , 如果备择假设分布服从正态分布 , 那么就可以利用这个在一次性抽样中所得到的 Z 值来作为估计备择假设分布的中心点 , 以此作为该次实验中 备 择 假 设 分 布 的 期 望 值 The exp ec ted Z va lue,或称为备择假设分布的平均值 , 通常用希腊 字母“表示备择假设分布的期望 Z 值 。并假定在图 2 3. 0时的 值分布及统计检验力示意图在 0. 05 水平上进行双侧检验时 , 作出接受或拒绝虚无假设的临界值是 1. 96。以此为Z2分界点 , 通常的统计决策是 当实际得到的 Z 值小于 1. 96时 , 就认为没有充分理由拒绝虚无假设 , 这 时在虚无假设为假 , 备择假设为真时有可能犯“拒真的 型错误 , 其可能犯 型错误的概率值有如 图 2中阴影局部所示 ; 而当实际得到的 Z 值大于 1.96, 就会拒绝虚无假设 , 这时在虚无假设为假时就作 出了正确的决策 , 由于在正态分布条件下与 0.05相应的 Z 值是 1. 96, 因此 , 其正确拒绝虚无假设70心理学探新2021年的概率值有如图 2 中以 1196 为分界线所示的右边局部的面积 , 它等于 1 - 。由于做出决策的临界 值定为 1. 96, 它离备择假设分布的期望 Z 值 3. 0 约一个标准差 , 即 3. 0 - 1. 96 1. 04, 查正态分布表可知 , 阴影局部的面积 也就是犯 型错误的概率 约为 0. 15, 统计检验力 1 - 那么为 1 - 0. 15 0. 85。3 两独立样本平均数差异显著性检验统计检验力的估计方法根据上述统计检验力的估计原理 , 可以通过以 下几个步骤来估计两个独立样本平均数差异显著性检验统计检验力 1 - 的值 步骤 1根据条件建立需要检验的假设 ;步骤 2用相应的公式计算 Z 统计量 ;步骤 3 确定做出统计决策的 水平及相应的 临界值 ;步骤 4计算实际得到的 Z 值与 水平临界值 的差 ;步骤 5根据 Z 值与 水平临界值的差查正态分布表 , 确定可能犯的 型错误或统计检验力 1 - 的概率 。例如 , 有研究者在甲乙两校中分别抽取 100 名16岁的男生进行智商测查 , 测得甲乙两校该年龄组 男生总智商的平均分分别为 115分和 110 分 。根据常模 , 该年龄组男生总智商的标准差是 15 分 。那 么 , 求取甲乙两校 16岁男生平均智商差异显著性检验统计检验力的过程有如下述 。 解 数据是 步骤 5根据 Z 值与 水平临界值的差查正态分布表 , 确定可能犯的 型错误或统计检验力 1 - 的概率 查正态分布表 可知 , 从 中心 点 为零 到右 边0. 07个标准差所占的面积是 0. 0279, 加上中心点左 边的 0. 50 的面积 , 共有曲线下面积 0. 50 0. 0279 0. 5279, 约等于 53 如图 3 所示 。这就是本例 情况下估计出来的犯 型错误的概率值 , 其拒绝错误的虚无 假 设 , 接 受 正 确 备 择 假 设 的 概 率 是 1 - , 这 就 是 统 计 检 验 力 , 在 本 例 中 , 它 的 值 是 1 -0153 0. 47。图 3 本例中的备择假设分布图 0. 05如果用 Z 来表示图 3 中“拒绝 或 接受 虚无 假设 分界点到该正态分布曲线中点的距离 , 那么前述求取 或 1 - 过程中的前 4 步也可以用以下公式 3计算 。 X - X - 1 - 1 22公式 3 Z - Z2 21 2nn1 2在本例 中 , 假设 u u , 当显 著 性水 平为 1 20105时 , Z 1. 96, 代入公式 3可得 X - X - 1 - 115 - 1111 22Z - Z - 1196 1. 892 2152 1521 2100 100n1 100, X1 115,1 15 15nn1 2n2 100, X2 111,2- 1. 96 - 0. 07由此得到的H0 1 2H1 1 2 0. 07 与前述步骤 1 至步骤 4Z步骤 1建立假设 得到的结果是一样的 。上述计算说明 , 根据本例中的数据对平均数差 异显著性进行检验后 , 得到的 Z 统计量是 Z 1. 89, 步骤 2用公式 1计算检验统计量 X1 - X2 - 1 - 2 115 - 111 4Z 1. 892. 122 2152 152当显著性水平为 0. 05时 , Z 1. 89 Z 1. 96,1 22因此 , 接受虚无假设 , 认为两个样本平均数之间没有100 100n1 n2步骤 3确定做出统计决策的 水平并做出决显著差异 , 作出这种决策的统计检验力约为 47 。策 在显著性水平 0. 05 时 , 其临界值为Z这种计算平均数差异显著性检验统计检验力的过程只是评估方法之一 , 另外一种评估平均数差异显著 性检验统计检验力的方法是表格换算法 , 换算的根据之一是效果大小 effec t size d 值的评估值 。正因 为统计检验力 1 - 值与效果大小有着密切关联 , 因此 , 著名统计学家 J. Cohen 1992 把统计检验力 1- 定义为 “显著性检验的统计检验力是在给定总 体效果大小 effec t size , 显著性水平 和样本容量21. 96, 由于 Z 1. 89 Z 1. 96, 因此 , 正常情况下2做出的决策是 没有充分的把握推论差异不是由偶然因素造成的 , 换言之 , 没有充分理由去拒绝虚无假 设而接受虚无假设 。由此推断两校男生的总智商没有显著差异 , 其差异是由于偶然因素造成的 。在一般情况下 , 假设检验的过程至此已经完成 。 但是 , 如果要知道假设检验结果的统计检验力是多少 , 那么还需要做以下的工作 。步骤 4计算实际得到的 Z 值与 水平临界值 的差 , 得到 1. 89 - 1. 96 - 0. 07。 10 N 的条件下拒绝 H0 的概率 。4 两独立样本平均数差异显著性检验效果大小的 估计方法效果大小 effec t size,有时也被译为效应大小或效应值 是反映统计检验效果大小或处理效应大小 的重要指标 ,它表示不同处理下的总体平均数之间 差异的大小 ,可以在不同研究之间进行比拟 。考虑到“效应 一词在统计学中很多地方使用 ,如方差分析中的主效应 ,各因子效应等 ,为了不使读者产生不 必要的混淆 ,用效果大小一词来表示“effec t size的内涵 。效果大小反映了两个总体受某种事物的影响 后的差异程度 。平均数差异显著性检验的效果大小一般用符号 d 表示 。在两个独立样本的方差和样本容量都相等的条 件下 , 公式 2可作如下推导 要比女性要高 , 反映这种平均数的 d 值就可以这样来解释 , d 值越大那么更容易在实际生活中看到男性 比女性要高 , d 值越小那么在实际生活中看到男性比 女性高的可能性就会小些 。换言之 , d 值更能说明在实际生活中所关心的差异 , 而不是数据上的差异显著问题 。 d 值能知道观测到的差异是不是事实上 的差异 。 1 - 2 1 - 2 1 - 2 1 - 2 2 2 2 221 222nnnn n1 - 2 2, 由此可得 1 - 2 n公式 4 1 - 2 2令公式 5 d n那么有公式 6 d22进而有公式 7 d 图 4作为效果大小函数的两总体重叠图nnJ. Cohen 1992 认为 , d 0. 2 视为是低效果 , d 0. 5视为是中等程度的效果大小 , d 0. 8 视为是 高效果 。上述公式 5 就是求效果大小的具体方法 , 利用 这一公式 , 可以对前面求统计检验力的相应数据求该研究的效果大小 d 值 。的条件是 2由公式 6 可知 , 在实际计算过程中 ,值是 d 值 与样本量除以 2 之后的算术平方根两局部的乘积 。这说明 ,在其他条件不变的情况下 , d 值越大 ,值也会越大 ,而 值越大 , 那么统计检验力 1 - 也越大 , 因 此 , d值与统计检验力 1 - 之间存在正相关的关系 。d 值与统计检验力 1 - 之间有着密切关系 , 但也要注意这两者之间的区别 统计检验力 1 - 受样 本容量影响较大 , 而 d 值那么不受样本容量影响 。可以通过上述公式 5在不考虑样本容量的情况下来计 算某个心理研究中的 d 值 。我们也可以通过把 d 值视为两个总体分布的重叠量的途径来理解效果大小的内涵 。图 4列出了四种 d 值在两个总体中的重叠 情形 。图 4说明 , 表示效果大小的 d 值越大 , 重叠程度 就越小 , 平均数差异显著性检验的效果就会越明显 ;d 值越小那么相反 。也可以这样来理解 , 即不管你取哪种样本 , d 值总是作为一种标准的平均数差异的 估计 , 它与当前样本无关 。显然 , 传统的推断统计量 Z、t、F 或 2 值及相应的概率值 p值只是说明平均数的差异如何 , 但这种差异脱离样本推广到不同的抽 样群体时 , 差异究竟有多大那么需要用反映效果大小 的 d 值来描述 。比方说 , 一般情况下 , 男性平均身高n1 100, X1 115,1 15n2 100, X2 111,2 15由于 1 2 15, 因此可以利用公式 5 来计算 该研究的 d 值 , 将数据代入公式后得 1 - 2 115 - 111d 0. 2715即该研究的效果大小是 d 0. 27, 根据 J. Co2hen的观点 , 这属于较小程度的效果大小 。5 影响平均数差异显著性检验统计检验力的其他因素前面论述 了效 果大 小 与统 计检 验 力的 相互 关 系 , 即在其他条件不变的情 况 下 , 效果 大小 d 值 越大 , 统计检验力 1 - 值也越大 。此外 , 统计检验力1 - 还受“水平 和“样本量的大小 这两个因素 的影响 。n公式 6即 d2 说明 ,值是 d 值和样本容量72心理学探新2021年除 2后的算术平方根的乘积 。这说明 , 样本容量也是影响 值的因素之一 ,样本容量越大 ,值也越大 。 对于另外一个即“水平 因素 , 需要作进一步的说明 。正常情况下 , 中选择 0. 05 的临界水平 时 , 在正态分 布 的 情 况 下 , 其 相 应 的 Z 值 为 1. 96。以此为分界点 , 通常的统计决策是 当实际得到的 Z值大于 1. 96 时就会拒绝虚无假设 ; 实际得到的 Z 值 小于 1. 96 时就会接受虚无假设 。例如 , 前面所举的 例子中的检验结果是 Z 1. 89, 由于小于 Z 0. 05 1196的临界值 , 因此一般是接受虚无假设 , 认为甲乙两校男生在总智商方面没有显著差异 。做出这种 决策在虚无假设为假时就有可能犯 型错误 。如图3 所示 , 犯 型错误的概率约等于 53 , 与此相应的 统计检验力的值就是 1 - 0. 53 0. 47。如果做出决策时把 水平从 0. 05改为 0. 10的水平进行双尾检验 其接受或拒绝虚无假设 的临界点等同于在 0. 05 水平下进行单尾检验时的临界点 情况会是怎样呢 我们仍然用前面所举的例子为例 。通过前两个 求解步骤得到的检验统计量仍为 Z 1. 89。步骤 3确定做出统计决策的 水平并做出决 策 查正态分布表可知 , 在显著性水平 0. 10 双图 5 备择假设分布图 0. 10双侧检验 需要特别强调的是 , 当用上述五个步骤的方法 或公式 3来计算 型错误率或统计检验力 1 - 时 , 一定要根据是接受还是拒绝虚无假设的假设检验结 果 , 来确定通过 Z 统计量与显著性水平临界值之差 查 Z 分布表后所得到的概率值的两种不同意义 。意义 1当根据平均数差异显著性检验结果接 受虚无假设 如本文例子在 0. 05 双侧检验时 , 在虚无假设是真时 , 这是正确决策 ; 在虚无假设是假 时 , 就做了错误的决策 , 犯错误的概率是 ; 在本文 例子中 , 检验结果得到的 Z 统计量即 Z 1. 89 与显著性水平 0. 05双侧检验的临界值 1. 96 之Z2差为 0. 07, 查 Z 分布表可得对应于平均数到 0. 07个标准差的面积是约 0. 03, 如图 3 所示 , 由于是接受虚无假设 , 那么 , 临界值 1. 96 左边阴影局部Z2的面积都属于接受域 , 图中 1. 89是这次实验中备择假设分布的期望值 , 该点两边各占 50 的面积 , 而 临界点 1. 98 这个值在中心点 1. 89的右边 , 因此 , 阴影局部的面积就应该是 0. 50 0. 03 0. 53, 如果虚 无假设是 假 , 接 受 它 做 出 错 误 决 策 的 概 率 为 0153。意义 2当根据平均数差异显著性检验结果拒 绝虚无假设 如本文例子在 0. 10 双侧检验时 ,在虚无假设是真时 , 错误决策的概率是显著性水平; 在虚无假设是假时 , 就做了正确的决策 , 正确决 策的概率是 1 - 。在本文例子中 , 检验结果得到的Z 统计量即 Z 1. 89与显著性水平 0. 10双侧检侧 时 ,其临界值为 Z 1. 645,由于 Z 1. 89 Z 221. 645,因此 ,正常情况下做出的决策是拒绝虚无假设而接受备择假设 , 认为甲乙两校男生在总智商方面 ,甲校男生的总智商比乙校男生的总智商要更好 。 步骤 4计算实际得到的 Z 值与 水平临界值的差 , 得到 1. 89 - 1. 645 0. 245。步骤 5根据 Z 值与 水平临界值的差查正态 分布表 , 确定可能犯的 型错误或统计检验力 1 - 的概率 查正态分布表可知 , 查正态分布表可知 , 从中心点为零 到左 边 0. 245 个 标 准差 所占 的 面积 是0. 0968, 约等于 0. 10, 如图 5 所示 , 其阴影局部的概 率值为 0. 50 - 0. 10 0. 40。与前述一样 , Z 1189 的检验统计量作为估计备择假设分布的中心点 或期望值 , 建构一个正 态分布 1. 89 左右两边各 占 50 的 面积 , 以 Z 11645作为接受或拒绝假设的分界点 , 如果实际获 得的 Z 值小于 Z 11645 图 5 左边阴影局部 就接受虚无假设 , 这时如果虚无假设为假那么犯 型错误的概率值约为 40 ; 如果实际获得的 Z 值大于 Z 11645 图 5 右边局部 就拒绝虚无假设 , 这时如果 虚无假设为假那么是作出了正确的决策 , 其正确决策 的概率值是 1 - 1 - 0140 60 。验的临界值 1. 645 之差为 0. 245, 查 Z 分布表Z2可得对应于 平 均数 到 0. 245 个 标准 差 的面 积是 约0. 10。如图 5所示 , 与图 3 相似 , 临界值 1. 645Z2这次实验中是备择假设分布的期望值期望值 , 该点两边各占 50 的面积 , 其左边阴影局部的面积属于 接受域 , 由于 1. 645 这个值在中心点 1189 的左边 ,因此 , 阴影局部接受域的面积就应该是 0. 50 - 0. 10 0. 40, 如果虚无假设是假 , 这时拒绝它所做出正确 决策的概率为 1 - 1 - 0. 40 0160。统计检验力与 水平的关 系还 可 以通 过下 列 图 6来进一步理解 。该图说明 , 对于任何的 值 , 以及由横轴表示的相应于该 的统计检验力的值 , 其变化将是 的函数 。例如 , 在 2. 6 的情况下 , 当 0. 10 时 , 其统计检验力为 0. 83; 当 水平降低 到 0. 05 时 , 统计检验力也降低到 0. 74; 当 水平进一步降低到 0. 01 时 , 统计检验力就降低到只有 0. 50 了 。上述分析说明 , 统计检验力 1 - 与统计检验过 程中进行决策时的 水平是有密切关联的 , 统计检验力 1 - 的值随着 值的减小而降低 。随着 值的增大而增大 。犯 型错误的概率进行近似的估计 。统计检验力与效果大小具有密切的关系 。效果 大小 d 值是反映统计检验效果大小或处理效应大小 的重要指标 , 是指两个总体受某种事物的影响后的差异程度 。它与显著性水平 和样本容量 n 都是统计检验力评估中的重要影响因素 。总之 , 当检验结果是接受虚无假设时 , 人们更关 注犯 II型错误的概率 值的大小 , 或其反面即统计 检验力 1 - 值的大小 ,值越小 也即统计检验力越大 , 那么犯纳伪的可能性越小 ; 当检验结果是拒绝虚无假设时 , 人们更关注两个平均数之间的实际 差异即效果大小 d 值的大小 , d 值越大 , 反映实际差异越大 。图 6 作为固定 值的 的函数的统计检验力示意图6 总 结以平均数差异显著性检验为例介绍了假设检验后 估计统计检验力和效果大小的根本原理和估计方法 。估计统计检验力的根本原理是以对两种假设分布的分析为根底 。 虚无假设分布是以零为中心的正态分布 ,由于我们可以通过预先设定 水平的方式来控制当虚无假设为真时拒绝它可能会犯错误的概率 。因此 ,在此根底上 得到 的虚 无 假设 差异 显 著 性 检 验 的 Z 分布 或 t分布值 在置信度范围内也是以零为中心 的分布 a cen tra l Z o r t d istribu tion 。由于两个平均数之间不相等的值几乎是无限多的 ,因此 ,备择假设 H1 1 0 的分布值是一个不是 以零为中心的分布 , 它以什么值为中心也有着无数多个选择 , 因此 , 一般情况下是难以对 或 1 - 值作出准确的估计的 。当如果假设备择假设分布服 从正态分布 , 用在一次性抽样中所得到的 Z 值来作为估计备择假设分布的中心点 , 以此作为该次实验 中备择假设分布的期望值 , 并假定在备择假设的分布中 , 大于 值的备择假设的数量与小于 值的备择假设的数量各占 50 时 , 就可以由此来对可能参考文献美国心理协会 . 美国心理协会写作手册 第五版 . 陈玉玲等译 . 重庆大学出版社 , 2021 14 - 15张厚粲 ,孟庆茂 ,冯伯麟 . 心理与教育统计学 . 北京 北京 师范大学出版社 , 1988.张敏强 . 教育与心理统计学 修订版 . 北京 人民教育出 版社 , 2002.甘怡群 ,等 . 心理与行 为 科 学 统 计 . 北 京 北 京 大 学 出 版 社 , 2005.舒华 ,张亚 旭著 . 心理 学 研 究 方 法 . 北 京 人 民 教 育 出 版 社 , 2021.12345B a rry H. Cohen. Exp la in ing p sycho logica l sta tistic s. 3 rd E26d ition. N ew Yo rk U n ive rsity, 2021.A rthu r A ron, E la ine N. A ron. Sta tistic s fo r p sycho logy. 影 印版 . 北京 世界图书出版公司 , 2006.78D avid C. Howe ll. Fundam en ta l sta tistic s fo r the behavio ra lsd ience. B rook s /Co le Pub lish ing Comp any, 1999.R icha rd P. R unyon. Fundam en ta ls of behavio ra l sta tistic s.北京 人民邮电出版社 , 2004.910 Cohen J. A powe r p rim e r. P sycho logica l B u lle tin, 1992,112 155 - 159.The Pr in c ip le an d M e thodof E st im a t in g the S ta t ist ica lPower an d Effec t S ize W hen M a ke Z Te stH u Zhu jing Schoo l of P sycho logy, J iangxi No rm a l U n ive rsity, N anchang 30022 A b stra c t Th is p ap e r taked an examp le of the sta tistica l ana lysis of sign ifican t d iffe rence be tween m ean va lue s, afte r hypo the sis te stingthe exp e rim en ta l da ta, th is p ap e r b riefly in troduc ted the ba sic p rinc ip le and m e thod s of e stim a ting the powe r of te st and effec t size.Key word s sta tistica l ana lysis of sign ifican t d iffe rence be tween m ean va lue s; hypo the sis te sting; the powe r of te st; effec t size