什么是单样本t检验?

学生t 检验(英语:Student's t-test)是指零假设成立时的任一检验统计有学生t分布的统计假设检验,属于参数统计。学生t检验常作为检验一群来自正态分配总体的独立样本之期望值是否为某一实数,或是二(两)群来自正态分配总体的独立样本之期望值的差是否为某一实数。举个简单的例子,在某个学校中我们可以从某个年级中随机抽样一群男生,以检验该年级男生与全校男生之身高差异程度是否如我们所假设的某个值。

常见的应用有:

  • 单样本检验:检验一个正态分布的总体的均值是否在满足零假设的值之内,例如检验一群军校男生的身高的平均是否符合全国标准的170公分界线。
  • 独立样本t检验(双样本):其零假设为两个正态分布的总体的均值之差为某实数,例如检验二群人之平均身高是否相等。若两总体的方差是相等的情况下(同质方差),自由度为两样本数相加再减二;若为异方差(总体方差不相等),自由度则为Welch自由度,此情况下有时被称为Welch检验。
  • 配对样本t检验(成对样本t检验):检验自同一总体抽出的成对样本间差异是否为零。例如,检测一位病人接受治疗前和治疗后的肿瘤尺寸大小。若治疗是有效的,我们可以推定多数病人接受治疗后,肿瘤尺寸将缩小。
  • 检验一回归模型的偏回归系数是否显著不为零,即检验解释变量X是否存在对被解释变量Y的解释能力,其检验统计量称之为t-比例(t-ratio)。

前提假设[编辑]

大多数的t检验之统计量具有t = Z/s的形式,其中Z与s是已知资料的函数。Z通常被设计成对于备择假设有关的形式,而s是一个比例母数使t服从于t分布。以单样本t检验为例,Z=X¯/(σ/n){\displaystyle Z={\bar {X}}/(\sigma /{\sqrt {n}})}

什么是单样本t检验?
,其中X¯{\displaystyle {\bar {X}}}
什么是单样本t检验?
为样本平均数,n{\displaystyle n}
什么是单样本t检验?
为样本数,σ{\displaystyle \sigma }
什么是单样本t检验?
为总体标准差。至于s在单样本t检验中为σ^/σ{\displaystyle {\hat {\sigma }}/\sigma }
什么是单样本t检验?
,其中σ^{\displaystyle {\hat {\sigma }}}
什么是单样本t检验?
为样本的标准差。在符合零假说的条件下,t检验有以下前提:

  • Z 服从标准正态分布
  • (n - 1)s2 服从自由度(n - 1)的卡方分布
  • Z与s互相独立

单样本t检验[编辑]

检验零假设为一群来自正态分配独立样本xi之总体期望值μ为μ0可利用以下统计量

t=x¯−μ0s/n{\displaystyle t={\frac {{\overline {x}}-\mu _{0}}{s/{\sqrt {n}}}}}

其中i=1…n{\displaystyle i=1\ldots n}

什么是单样本t检验?
,x¯=∑i=1nxin{\displaystyle {\overline {x}}={\frac {\sum _{i=1}^{n}x_{i}}{n}}}
什么是单样本t检验?
为样本平均数,s=∑i=1n(xi−x¯)2n−1{\displaystyle s={\sqrt {\frac {\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}{n-1}}}}
什么是单样本t检验?
为样本标准差,n为样本数。该统计量t在零假设:μ = μ0为真的条件下服从自由度为n − 1的t分布。

配对样本t检验[编辑]

配对样本t检验可视为单样本t检验的扩展,不过检验的对象由一群来自正态分配独立样本更改为两配对样本之观测值之差。

若两配对样本x1i与x2i之差为di = x1i − x2i独立且来自正态分配,则di之总体期望值μ是否为μ0可利用以下统计量

t=d¯−μ0sd/n{\displaystyle t={\frac {{\overline {d}}-\mu _{0}}{s_{d}/{\sqrt {n}}}}}

其中i=1…n{\displaystyle i=1\ldots n},d¯=∑i=1ndin{\displaystyle {\overline {d}}={\frac {\sum _{i=1}^{n}d_{i}}{n}}}

什么是单样本t检验?
为配对样本差值之平均数,sd=∑i=1n(di−d¯)2n−1{\displaystyle s_{d}={\sqrt {\frac {\sum _{i=1}^{n}(d_{i}-{\overline {d}})^{2}}{n-1}}}}
什么是单样本t检验?
为配对样本差值之标准差,n为配对样本数。该统计量t在零假设:μ = μ0为真的条件下服从自由度为n − 1的t分布。

独立双样本t检验[编辑]

同质方差假设 (Homoscedasticity)、样本数相等[编辑]

若两独立样本x1i与x2i具有相同之样本数n,且来自两个总体方差相同(同质方差假设)的正态分配,则两总体之期望值差μ1 - μ2是否为μ0可利用以下统计量

t=x¯1−x¯2−μ02sp2/n{\displaystyle t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {2s_{p}^{2}/n}}}}

其中i=1…n{\displaystyle i=1\ldots n},x¯1=(∑i=1nx1i)/n{\displaystyle {\overline {x}}_{1}=(\sum _{i=1}^{n}x_{1i})/n}

什么是单样本t检验?
及x¯2=(∑i=1nx2i)/n{\displaystyle {\overline {x}}_{2}=(\sum _{i=1}^{n}x_{2i})/n}
什么是单样本t检验?
为两样本各自的平均数,sp2=(∑i=1n(x1i−x¯1)2+∑i=1n(x2i−x¯2)2)/(2n−2){\displaystyle s_{p}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}+\sum _{i=1}^{n}(x_{2i}-{\overline {x}}_{2})^{2})/(2n-2)}
什么是单样本t检验?
为样本之共同方差。该统计量t在零假设:μ1 - μ2 = μ0为真的条件下服从自由度为2n − 2的t分布。

同质方差假设 (Homoscedasticity)、样本数不相等[编辑]

若两独立样本x1i与x2j具有不相同之样本数n1与n2,且来自两个总体方差相同(同质方差假设)的正态分配,则两总体之期望值之差μ1 - μ2是否为μ0可利用以下统计量

t=x¯1−x¯2−μ0sp2/n1+sp2/n2{\displaystyle t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {s_{p}^{2}/n_{1}+s_{p}^{2}/n_{2}}}}}

其中i=1…n1{\displaystyle i=1\ldots n_{1}}

什么是单样本t检验?
,其中j=1…n2{\displaystyle j=1\ldots n_{2}}
什么是单样本t检验?
,x¯1=(∑i=1nx1i)/n{\displaystyle {\overline {x}}_{1}=(\sum _{i=1}^{n}x_{1i})/n}及x¯2=(∑i=1nx2i)/n{\displaystyle {\overline {x}}_{2}=(\sum _{i=1}^{n}x_{2i})/n}为两样本各自的平均数,sp2=(∑i=1n(x1i−x¯1)2+∑j=1n(x2j−x¯2)2)/(n1+n2−2){\displaystyle s_{p}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}+\sum _{j=1}^{n}(x_{2j}-{\overline {x}}_{2})^{2})/(n_{1}+n_{2}-2)}
什么是单样本t检验?
为两样本共同之方差。该统计量t在零假设:μ1 - μ2 = μ0为真的条件下服从自由度为n1 + n2 − 2的t分布。

异方差假设 (Heteroscedasticity)[编辑]

若两独立样本x1i与x2j具有相同或不相同之样本数n1与n2,且两者总体方差不相等(异方差假设)的正态分配,则两总体之期望值之差μ1 - μ2是否为μ0可利用以下统计量

t=x¯1−x¯2−μ0s12/n1+s22/n2{\displaystyle t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2}}}}}

其中i=1…n1{\displaystyle i=1\ldots n_{1}},其中j=1…n2{\displaystyle j=1\ldots n_{2}},x¯1=(∑i=1n1x1i)/n1{\displaystyle {\overline {x}}_{1}=(\sum _{i=1}^{n_{1}}x_{1i})/n_{1}}

什么是单样本t检验?
及x¯2=(∑j=1n2x2j)/n{\displaystyle {\overline {x}}_{2}=(\sum _{j=1}^{n_{2}}x_{2j})/n}
什么是单样本t检验?
为两样本各自的平均数,s12=(∑i=1n(x1i−x¯1)2)/(n1−1){\displaystyle s_{1}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2})/(n_{1}-1)}
什么是单样本t检验?
及s22=(∑j=1n(x2j−x¯2)2)/(n2−1){\displaystyle s_{2}^{2}=(\sum _{j=1}^{n}(x_{2j}-{\overline {x}}_{2})^{2})/(n_{2}-1)}
什么是单样本t检验?
分别为两样本之方差。该统计量t在零假设:μ1 - μ2 = μ0为真的条件下服从自由度为

df=(s12/n1+s22/n2)2(s12/n1)2/(n1−1)+(s22/n2)2/(n2−1){\displaystyle df={\frac {(s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2})^{2}}{(s_{1}^{2}/n_{1})^{2}/(n_{1}-1)+(s_{2}^{2}/n_{2})^{2}/(n_{2}-1)}}}

之t分布。这种方法又常称为Welch检验。

其它相关检验[编辑]

偏回归系数是否为零之检验[编辑]

以简单线性回归为例[编辑]

模型假设:

yi=α+βxi+εi,{\displaystyle y_{i}=\alpha +\beta x_{i}+\varepsilon _{i},}

其中xi,i = 1, ..., n为已知,α与β为未知系数,εi为残差独立且服从期望值0且方差σ2未知的正态分布,yi,i = 1, ..., n为观测值。我们可以检验回归系数β是否相等于特定的β0,通常使β0 = 0以检验xi对yi是否存在解释能力,在此例(简单线性回归模型)即为检验回归式之斜率是否为零。

令α^{\displaystyle {\widehat {\alpha }}}

什么是单样本t检验?
与β^{\displaystyle {\widehat {\beta }}}
什么是单样本t检验?
为最小二乘法之估计值,SEα^{\displaystyle SE_{\widehat {\alpha }}}
什么是单样本t检验?
与SEβ^{\displaystyle SE_{\widehat {\beta }}}
什么是单样本t检验?
为最小二乘法估计值之标准误差,则

t=β^−β0SEβ^∼Tn−2{\displaystyle t={\frac {{\widehat {\beta }}-\beta _{0}}{SE_{\widehat {\beta }}}}\sim {\mathcal {T}}_{n-2}}

在零假设为β = β0的情况下服从自由度为n − 2之t分布,此检验统计量被称作“t比率 (t-ratio)”,其中

SEβ^=1n−2∑i=1n(yi−y^i)2∑i=1n(xi−x¯)2{\displaystyle SE_{\widehat {\beta }}={\frac {\sqrt {{\frac {1}{n-2}}\sum _{i=1}^{n}(y_{i}-{\widehat {y}}_{i})^{2}}}{\sqrt {\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}}}}

由于 ε^i=yi−y^i=yi−(α^+β^xi){\displaystyle {\widehat {\varepsilon }}_{i}=y_{i}-{\widehat {y}}_{i}=y_{i}-({\widehat {\alpha }}+{\widehat {\beta }}x_{i})}

什么是单样本t检验?
为残差(即估计误差),而 SSR=∑i=1nε^i2{\displaystyle {\text{SSR}}=\sum _{i=1}^{n}{\widehat {\varepsilon }}_{i}^{\;2}}
什么是单样本t检验?
为残差之离均平方和,我们可改写t为

t=(β^−β0)n−2SSR/∑i=1n(xi−x¯)2{\displaystyle t={\frac {({\widehat {\beta }}-\beta _{0}){\sqrt {n-2}}}{\sqrt {{\text{SSR}}/\sum _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}}}}}

另请参阅:F检验

电脑软件[编辑]

大多数的试算表软件及统计软件,诸如QtiPlot、OpenOffice.org Calc、LibreOffice Calc、Microsoft Excel、SAS、SPSS、Stata、DAP、gretl、R、Python ([1](页面存档备份,存于互联网档案馆))、PSPP、Minitab等,都可以进行t检验运算。

什么时候使用T检验?

t检验,亦称student t检验(Student's t test),主要于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。 t检验用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。 它与f检验、卡方检验并列。

T

t检验主要分为以下几种类型:.
单样本t-tests( one-sample t-tests ).
非配对t检验或独立t检验( unpaired t-test or independent t-test ): Student's t-test(方差齐) ... .
配对t检验( paired t-test ).

T检验怎么判断?

t检验是一种适合小样本数据的假设检验方法,通过比较不同数据的均值,研究两组数据之间是否存在差异。 解读t检验的结果,首先判断p 值是否呈现出显著性,如果呈现出显著性,则说明两组数据具有显著性差异,具体的差异可通过平均值进行对比判断