学生t 检验(英语:Student's t-test)是指零假设成立时的任一检验统计有学生t分布的统计假设检验,属于参数统计。学生t检验常作为检验一群来自正态分配总体的独立样本之期望值是否为某一实数,或是二(两)群来自正态分配总体的独立样本之期望值的差是否为某一实数。举个简单的例子,在某个学校中我们可以从某个年级中随机抽样一群男生,以检验该年级男生与全校男生之身高差异程度是否如我们所假设的某个值。 常见的应用有:
前提假设[编辑]大多数的t检验之统计量具有t = Z/s的形式,其中Z与s是已知资料的函数。Z通常被设计成对于备择假设有关的形式,而s是一个比例母数使t服从于t分布。以单样本t检验为例,Z=X¯/(σ/n){\displaystyle Z={\bar {X}}/(\sigma /{\sqrt {n}})} ,其中X¯{\displaystyle {\bar {X}}}为样本平均数,n{\displaystyle n}为样本数,σ{\displaystyle \sigma }为总体标准差。至于s在单样本t检验中为σ^/σ{\displaystyle {\hat {\sigma }}/\sigma },其中σ^{\displaystyle {\hat {\sigma }}}为样本的标准差。在符合零假说的条件下,t检验有以下前提:
单样本t检验[编辑]检验零假设为一群来自正态分配独立样本xi之总体期望值μ为μ0可利用以下统计量 其中i=1…n{\displaystyle i=1\ldots n} ,x¯=∑i=1nxin{\displaystyle {\overline {x}}={\frac {\sum _{i=1}^{n}x_{i}}{n}}}为样本平均数,s=∑i=1n(xi−x¯)2n−1{\displaystyle s={\sqrt {\frac {\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}{n-1}}}}为样本标准差,n为样本数。该统计量t在零假设:μ = μ0为真的条件下服从自由度为n − 1的t分布。配对样本t检验[编辑]配对样本t检验可视为单样本t检验的扩展,不过检验的对象由一群来自正态分配独立样本更改为两配对样本之观测值之差。 若两配对样本x1i与x2i之差为di = x1i − x2i独立且来自正态分配,则di之总体期望值μ是否为μ0可利用以下统计量 t=d¯−μ0sd/n{\displaystyle t={\frac {{\overline {d}}-\mu _{0}}{s_{d}/{\sqrt {n}}}}}其中i=1…n{\displaystyle i=1\ldots n},d¯=∑i=1ndin{\displaystyle {\overline {d}}={\frac {\sum _{i=1}^{n}d_{i}}{n}}} 为配对样本差值之平均数,sd=∑i=1n(di−d¯)2n−1{\displaystyle s_{d}={\sqrt {\frac {\sum _{i=1}^{n}(d_{i}-{\overline {d}})^{2}}{n-1}}}}为配对样本差值之标准差,n为配对样本数。该统计量t在零假设:μ = μ0为真的条件下服从自由度为n − 1的t分布。独立双样本t检验[编辑]同质方差假设 (Homoscedasticity)、样本数相等[编辑]若两独立样本x1i与x2i具有相同之样本数n,且来自两个总体方差相同(同质方差假设)的正态分配,则两总体之期望值差μ1 - μ2是否为μ0可利用以下统计量 t=x¯1−x¯2−μ02sp2/n{\displaystyle t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {2s_{p}^{2}/n}}}}其中i=1…n{\displaystyle i=1\ldots n},x¯1=(∑i=1nx1i)/n{\displaystyle {\overline {x}}_{1}=(\sum _{i=1}^{n}x_{1i})/n} 及x¯2=(∑i=1nx2i)/n{\displaystyle {\overline {x}}_{2}=(\sum _{i=1}^{n}x_{2i})/n}为两样本各自的平均数,sp2=(∑i=1n(x1i−x¯1)2+∑i=1n(x2i−x¯2)2)/(2n−2){\displaystyle s_{p}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}+\sum _{i=1}^{n}(x_{2i}-{\overline {x}}_{2})^{2})/(2n-2)}为样本之共同方差。该统计量t在零假设:μ1 - μ2 = μ0为真的条件下服从自由度为2n − 2的t分布。同质方差假设 (Homoscedasticity)、样本数不相等[编辑]若两独立样本x1i与x2j具有不相同之样本数n1与n2,且来自两个总体方差相同(同质方差假设)的正态分配,则两总体之期望值之差μ1 - μ2是否为μ0可利用以下统计量 t=x¯1−x¯2−μ0sp2/n1+sp2/n2{\displaystyle t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {s_{p}^{2}/n_{1}+s_{p}^{2}/n_{2}}}}}其中i=1…n1{\displaystyle i=1\ldots n_{1}} ,其中j=1…n2{\displaystyle j=1\ldots n_{2}},x¯1=(∑i=1nx1i)/n{\displaystyle {\overline {x}}_{1}=(\sum _{i=1}^{n}x_{1i})/n}及x¯2=(∑i=1nx2i)/n{\displaystyle {\overline {x}}_{2}=(\sum _{i=1}^{n}x_{2i})/n}为两样本各自的平均数,sp2=(∑i=1n(x1i−x¯1)2+∑j=1n(x2j−x¯2)2)/(n1+n2−2){\displaystyle s_{p}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}+\sum _{j=1}^{n}(x_{2j}-{\overline {x}}_{2})^{2})/(n_{1}+n_{2}-2)}为两样本共同之方差。该统计量t在零假设:μ1 - μ2 = μ0为真的条件下服从自由度为n1 + n2 − 2的t分布。异方差假设 (Heteroscedasticity)[编辑]若两独立样本x1i与x2j具有相同或不相同之样本数n1与n2,且两者总体方差不相等(异方差假设)的正态分配,则两总体之期望值之差μ1 - μ2是否为μ0可利用以下统计量 t=x¯1−x¯2−μ0s12/n1+s22/n2{\displaystyle t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2}}}}}其中i=1…n1{\displaystyle i=1\ldots n_{1}},其中j=1…n2{\displaystyle j=1\ldots n_{2}},x¯1=(∑i=1n1x1i)/n1{\displaystyle {\overline {x}}_{1}=(\sum _{i=1}^{n_{1}}x_{1i})/n_{1}} 及x¯2=(∑j=1n2x2j)/n{\displaystyle {\overline {x}}_{2}=(\sum _{j=1}^{n_{2}}x_{2j})/n}为两样本各自的平均数,s12=(∑i=1n(x1i−x¯1)2)/(n1−1){\displaystyle s_{1}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2})/(n_{1}-1)}及s22=(∑j=1n(x2j−x¯2)2)/(n2−1){\displaystyle s_{2}^{2}=(\sum _{j=1}^{n}(x_{2j}-{\overline {x}}_{2})^{2})/(n_{2}-1)}分别为两样本之方差。该统计量t在零假设:μ1 - μ2 = μ0为真的条件下服从自由度为df=(s12/n1+s22/n2)2(s12/n1)2/(n1−1)+(s22/n2)2/(n2−1){\displaystyle df={\frac {(s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2})^{2}}{(s_{1}^{2}/n_{1})^{2}/(n_{1}-1)+(s_{2}^{2}/n_{2})^{2}/(n_{2}-1)}}}之t分布。这种方法又常称为Welch检验。 其它相关检验[编辑]偏回归系数是否为零之检验[编辑]以简单线性回归为例[编辑]模型假设: 其中xi,i = 1, ..., n为已知,α与β为未知系数,εi为残差独立且服从期望值0且方差σ2未知的正态分布,yi,i = 1, ..., n为观测值。我们可以检验回归系数β是否相等于特定的β0,通常使β0 = 0以检验xi对yi是否存在解释能力,在此例(简单线性回归模型)即为检验回归式之斜率是否为零。 令α^{\displaystyle {\widehat {\alpha }}} 与β^{\displaystyle {\widehat {\beta }}}为最小二乘法之估计值,SEα^{\displaystyle SE_{\widehat {\alpha }}}与SEβ^{\displaystyle SE_{\widehat {\beta }}}为最小二乘法估计值之标准误差,则t=β^−β0SEβ^∼Tn−2{\displaystyle t={\frac {{\widehat {\beta }}-\beta _{0}}{SE_{\widehat {\beta }}}}\sim {\mathcal {T}}_{n-2}}在零假设为β = β0的情况下服从自由度为n − 2之t分布,此检验统计量被称作“t比率 (t-ratio)”,其中 SEβ^=1n−2∑i=1n(yi−y^i)2∑i=1n(xi−x¯)2{\displaystyle SE_{\widehat {\beta }}={\frac {\sqrt {{\frac {1}{n-2}}\sum _{i=1}^{n}(y_{i}-{\widehat {y}}_{i})^{2}}}{\sqrt {\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}}}}由于 ε^i=yi−y^i=yi−(α^+β^xi){\displaystyle {\widehat {\varepsilon }}_{i}=y_{i}-{\widehat {y}}_{i}=y_{i}-({\widehat {\alpha }}+{\widehat {\beta }}x_{i})} 为残差(即估计误差),而 SSR=∑i=1nε^i2{\displaystyle {\text{SSR}}=\sum _{i=1}^{n}{\widehat {\varepsilon }}_{i}^{\;2}} 为残差之离均平方和,我们可改写t为t=(β^−β0)n−2SSR/∑i=1n(xi−x¯)2{\displaystyle t={\frac {({\widehat {\beta }}-\beta _{0}){\sqrt {n-2}}}{\sqrt {{\text{SSR}}/\sum _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}}}}}另请参阅:F检验 电脑软件[编辑]大多数的试算表软件及统计软件,诸如QtiPlot、OpenOffice.org Calc、LibreOffice Calc、Microsoft Excel、SAS、SPSS、Stata、DAP、gretl、R、Python ([1](页面存档备份,存于互联网档案馆))、PSPP、Minitab等,都可以进行t检验运算。 什么时候使用T检验?t检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。 t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。 它与f检验、卡方检验并列。
Tt检验主要分为以下几种类型:. 单样本t-tests( one-sample t-tests ). 非配对t检验或独立t检验( unpaired t-test or independent t-test ): Student's t-test(方差齐) ... . 配对t检验( paired t-test ). T检验怎么判断?t检验是一种适合小样本数据的假设检验方法,通过比较不同数据的均值,研究两组数据之间是否存在差异。 解读t检验的结果,首先判断p 值是否呈现出显著性,如果呈现出显著性,则说明两组数据具有显著性差异,具体的差异可通过平均值进行对比判断。
|