学生t 检验(英语:Student's t-test)是指零假设成立时的任一检验统计有学生t分布的统计假设检验,属于参数统计。学生t检验常作为检验一群来自正态分配总体的独立样本之期望值是否为某一实数,或是二(两)群来自正态分配总体的独立样本之期望值的差是否为某一实数。举个简单的例子,在某个学校中我们可以从某个年级中随机抽样一群男生,以检验该年级男生与全校男生之身高差异程度是否如我们所假设的某个值。
常见的应用有:
- 单样本检验:检验一个正态分布的总体的均值是否在满足零假设的值之内,例如检验一群军校男生的身高的平均是否符合全国标准的170公分界线。
- 独立样本t检验(双样本):其零假设为两个正态分布的总体的均值之差为某实数,例如检验二群人之平均身高是否相等。若两总体的方差是相等的情况下(同质方差),自由度为两样本数相加再减二;若为异方差(总体方差不相等),自由度则为Welch自由度,此情况下有时被称为Welch检验。
- 配对样本t检验(成对样本t检验):检验自同一总体抽出的成对样本间差异是否为零。例如,检测一位病人接受治疗前和治疗后的肿瘤尺寸大小。若治疗是有效的,我们可以推定多数病人接受治疗后,肿瘤尺寸将缩小。
- 检验一回归模型的偏回归系数是否显著不为零,即检验解释变量X是否存在对被解释变量Y的解释能力,其检验统计量称之为t-比例(t-ratio)。
前提假设[编辑]
大多数的t检验之统计量具有t = Z/s的形式,其中Z与s是已知资料的函数。Z通常被设计成对于备择假设有关的形式,而s是一个比例母数使t服从于t分布。以单样本t检验为例,Z=X¯/(σ/n){\displaystyle Z={\bar {X}}/(\sigma /{\sqrt {n}})}
- Z 服从标准正态分布
- (n - 1)s2 服从自由度(n - 1)的卡方分布
- Z与s互相独立
单样本t检验[编辑]
检验零假设为一群来自正态分配独立样本xi之总体期望值μ为μ0可利用以下统计量
t=x¯−μ0s/n{\displaystyle t={\frac {{\overline {x}}-\mu _{0}}{s/{\sqrt {n}}}}}其中i=1…n{\displaystyle i=1\ldots n}
配对样本t检验[编辑]
配对样本t检验可视为单样本t检验的扩展,不过检验的对象由一群来自正态分配独立样本更改为两配对样本之观测值之差。
若两配对样本x1i与x2i之差为di = x1i − x2i独立且来自正态分配,则di之总体期望值μ是否为μ0可利用以下统计量
t=d¯−μ0sd/n{\displaystyle t={\frac {{\overline {d}}-\mu _{0}}{s_{d}/{\sqrt {n}}}}}其中i=1…n{\displaystyle i=1\ldots n},d¯=∑i=1ndin{\displaystyle {\overline {d}}={\frac {\sum _{i=1}^{n}d_{i}}{n}}}
独立双样本t检验[编辑]
同质方差假设 (Homoscedasticity)、样本数相等[编辑]
若两独立样本x1i与x2i具有相同之样本数n,且来自两个总体方差相同(同质方差假设)的正态分配,则两总体之期望值差μ1 - μ2是否为μ0可利用以下统计量
t=x¯1−x¯2−μ02sp2/n{\displaystyle t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {2s_{p}^{2}/n}}}}其中i=1…n{\displaystyle i=1\ldots n},x¯1=(∑i=1nx1i)/n{\displaystyle {\overline {x}}_{1}=(\sum _{i=1}^{n}x_{1i})/n}
同质方差假设 (Homoscedasticity)、样本数不相等[编辑]
若两独立样本x1i与x2j具有不相同之样本数n1与n2,且来自两个总体方差相同(同质方差假设)的正态分配,则两总体之期望值之差μ1 - μ2是否为μ0可利用以下统计量
t=x¯1−x¯2−μ0sp2/n1+sp2/n2{\displaystyle t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {s_{p}^{2}/n_{1}+s_{p}^{2}/n_{2}}}}}其中i=1…n1{\displaystyle i=1\ldots n_{1}}
异方差假设 (Heteroscedasticity)[编辑]
若两独立样本x1i与x2j具有相同或不相同之样本数n1与n2,且两者总体方差不相等(异方差假设)的正态分配,则两总体之期望值之差μ1 - μ2是否为μ0可利用以下统计量
t=x¯1−x¯2−μ0s12/n1+s22/n2{\displaystyle t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2}}}}}其中i=1…n1{\displaystyle i=1\ldots n_{1}},其中j=1…n2{\displaystyle j=1\ldots n_{2}},x¯1=(∑i=1n1x1i)/n1{\displaystyle {\overline {x}}_{1}=(\sum _{i=1}^{n_{1}}x_{1i})/n_{1}}
之t分布。这种方法又常称为Welch检验。
其它相关检验[编辑]
偏回归系数是否为零之检验[编辑]
以简单线性回归为例[编辑]模型假设:
yi=α+βxi+εi,{\displaystyle y_{i}=\alpha +\beta x_{i}+\varepsilon _{i},}其中xi,i = 1, ..., n为已知,α与β为未知系数,εi为残差独立且服从期望值0且方差σ2未知的正态分布,yi,i = 1, ..., n为观测值。我们可以检验回归系数β是否相等于特定的β0,通常使β0 = 0以检验xi对yi是否存在解释能力,在此例(简单线性回归模型)即为检验回归式之斜率是否为零。
令α^{\displaystyle {\widehat {\alpha }}}
在零假设为β = β0的情况下服从自由度为n − 2之t分布,此检验统计量被称作“t比率 (t-ratio)”,其中
SEβ^=1n−2∑i=1n(yi−y^i)2∑i=1n(xi−x¯)2{\displaystyle SE_{\widehat {\beta }}={\frac {\sqrt {{\frac {1}{n-2}}\sum _{i=1}^{n}(y_{i}-{\widehat {y}}_{i})^{2}}}{\sqrt {\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}}}}由于 ε^i=yi−y^i=yi−(α^+β^xi){\displaystyle {\widehat {\varepsilon }}_{i}=y_{i}-{\widehat {y}}_{i}=y_{i}-({\widehat {\alpha }}+{\widehat {\beta }}x_{i})}
另请参阅:F检验
电脑软件[编辑]
大多数的试算表软件及统计软件,诸如QtiPlot、OpenOffice.org Calc、LibreOffice Calc、Microsoft Excel、SAS、SPSS、Stata、DAP、gretl、R、Python ([1](页面存档备份,存于互联网档案馆))、PSPP、Minitab等,都可以进行t检验运算。