样本均值的分布与假设检验初步
本章概览
在前面几讲的学习中,我们研究的是总体或者总体中抽取的单独一个样本。而在实际的研究中,我们抽取的样本远远不止三个。在本章,我们将所有这些可抽取的样本构成一个集合,学习它们之间、它们与总体之间的关系。此外,我们还将初步了解假设检验的程序和两类错误。
学习要点
- 掌握样本均值分布的特性(形状、均值、标准误);
- 区分标准误、标准差和取样误差;
- 学会利用中心极限定律求解标准误;
- 学会计算样本均值分布中的概率;
- 掌握假设检验的基本步骤;
- 学会分辨假设检验的两类错误;
样本均值分布
在前面的学习中,我们涉及的都是原始数据的分布。一个总体中所有原始分数的分布就形成了总体分布 (population distribution) 。但是在实际的研究中,我们往往无法对总体分布进行直接考察,而是从这个总体中抽取出个体作为样本进行考察,抽取出来的样本的分数就形成了样本分布 (sample distribution) 。当然我们可以从同一总体中抽取出很多个样本。总体中抽取的所有可能的特定容量分布的统计量所形成的统计分布就是取样分布 (sampling distribution)。
取样分布的一个特例便是样本均值的分布 (distribution of sample means)。它是指总体中可抽取的所有可能的特定容量 (
样本均值的分布在形状上接近正态分布,而且在无偏估计下,样本均值分布的均值是等于总体均值的。当我们得到所有均值时,它们的均值就完全与总体相等了,因此所有样本均值的平均值叫做
中心极限定律
标准误
- 标准误指样本均值分布的标准差,是反映样本均值分布变异性的指标。 标准误
, 为总体的标准差, 为样本容量。
大数定律 (law of large numbers)
- 随样本容量的的增大,样本均值与总体均值之间的误差会减小。
中心极限定律 (central limit theorem)
- 对于任何均值为
,标准差为 的总体, 样本容量为 的样本均值的分布,随着 趋近无穷大时,会趋近均值为 ,标准差为 的正态分布。 - 应用条件:通常在
时,我们认为样本均值的分布满足中心极限定律。 - 中心极限定律综合了样本均值的三个主要特性:形状、均值和方差。
样本均值分布的概率
我们同样可以用 z 分数来描述选取的一个样本在样本均值分布中的位置。但是这里使用的计算 z 分数的公式与之前有所不同:
这里我们把单个分数替换为样本均值,把之前使用的标准差替换为前面提到的标准误,而所对应的分布为样本均值分布。每一个样本均值都有一个所对应的 z 分数,我们可以通过已知的 z 分数求出样本均值的概率。
假设检验及其基本逻辑
假设检验 (Hypothesis testing)
- 定义:用样本数据来评价关于目标总体的某一假设的可置信性的推论程序。
- 可置信性:在多大程度上可以相信这个假设是正确的。程度的判断基于样本均值的概率分布。
- 两种假设:
- 备择假设:用
表示,表明因变量的变化确实是由于自变量的作用。 - 虚无假设:用
表示,意为实际上什么也没有发生。
- 备择假设:用
- 显著性水平 (
):在检验过程中,我们假设虚无假设是真实的,同时计算出观测到的差异完全是由随机误差所致的概率,称为观测概率 。若 ,则拒绝虚无假设;如果 ,则不能拒绝虚无假设。
假设检验的基本逻辑
- 陈述假设:虚无假设与研究假设。
- 设定决策标准:找出 z 分数界定的临界区域。
- 收集数据,计算样本统计量。
- 做出决策:如果得出的 z 分数落在拒绝区域中,就拒绝
。
假设检验的两类错误
| 没有效应, | 存在效应, | |
|---|---|---|
| 拒绝 | I 类错误 | 正确 |
| 接受 | 正确 | II 类错误 |
| 两种错误,即: |
错误,第一类错误:拒绝 时所犯的错误,它原本成立,但被拒绝。即侦察到本不存在的差异。 错误,第二类错误:接受 时所犯的错误,它原本不成立,但被接受。即未能侦察到存在的差异。
显著性水平
在科学研究中,我们常常采取保守的策略,设定一个可接受的
芷沐沐