两样本均值显着性检定(下)
2020-06-15
连结:两样本均值显着性检定(上)
2.两母群体为常态分布且母体变异数未知
\(\text{(II)}\) 假设两母群体变异数不相等时 \((\sigma^2_1\ne\sigma^2_2)\)
假若我们获得两笔不同随机独立样本资料,此两笔独立样本抽样自两母群体,且两母群体都为常态分布且变异数未知但不相同时,可採用 Welch’s t 检定法。
Welch’s t 检定的统计量为:\(\displaystyle t’=\frac{|\overline{x}_1-\overline{x}_2|}{\sqrt{\frac{S^2_1}{n_1}+\frac{S^2_2}{n_2}}}~~~~~~~~~(3)\)
\((3)\) 式中的 \(\overline{x}_1\)、\(\overline{x}_2\) 为此两笔样本之平均值,两个样本变异数为 \(S^2_1\) 与 \(S^2_2\),\(n_1\)、\(n_2\) 则是两组样本抽样的样本数。但由于两母群体变异数不相同,所以无法直接套用 t 分布,因此需要对 t 分布的自由度做加权后才可以检定,加权过后的自由度为:
\(\displaystyle df’=\frac{\displaystyle\left(\frac{S^2_1}{n_1}+\frac{S^2_2}{n_2}\right)^2}{\displaystyle\frac{S^2_1/n_1}{n_1-1}+\frac{S^2_2/n_2}{n_2-1}}\)
举例来说,想要了解痛风病患与正常成人血中尿酸量均值是否相同,且两母群体变异数未知但不相同,随机抽取 10 位痛风病患以及 8 位正常成人并记录其血中尿酸量,随后各别计算痛风病患血中尿酸量平均值及变异数分别为 9.17 \((\overline{x}_1)\)、10.6001 \((S^2_1)\),而正常成人则为 5.795 \((\overline{x}_2)\)、1.145 \((S^2_2)\),则计算出来的 t 值为:
\(\displaystyle t’=\frac{|9.17-5.795|}{\sqrt{\frac{10.6001}{10}+\frac{1.145}{8}}}=3.076\)
加权过后的自由度为:
\(\displaystyle df’=\frac{\displaystyle\left(\frac{10.6001}{10}+\frac{1.145}{8}\right)^2}{\displaystyle\frac{10.6001/10}{10-1}+\frac{1.145/8}{8-1}}\)
计算出来的 \(t’\) 值可以与临界值 \(t_{0.025,df’}\) 比较,若 \(t’\) 小于这个临界值,我们就认为两样本之均值相同。在此範例中,由于 \(t’=3.076>t_{0.025,df’=2.19}\),显示痛风病患与正常成人血中尿酸量均值具有显着差异。
四、成对样本下两母群体平均值的假设检定
当我们得到一组由 n 个配对所构成的 n 个 \(d_i\) 随机样本,此配对样本的差值来自一个常态母群体时,其平均值 \(u_D\),变异数则为 \(\sigma^2_D\),但由于 \(\sigma^2_D\) 未知,因此可以利用 \(S^2_D\) 来估计,而 \(u_D\) 则为点估计 \(\overline{D}\) 来估计,\(\overline{D}\) 及 \(S^2_D\) 计算公式如下:
\(\displaystyle \overline{D}=\frac{\sum^n_{i=1}d_i}{n},~~~S^2_D=\frac{\sum^n_{i=1}(d_i-\overline{D})^2}{n-1}~~~~~~~~~(4)\)
\(d_i\) 为同一试验单位于不同环境下所获得观测值之差值,获得 \(\overline{D}\) 及 \(S^2_D\) 就可以检定 \(u_D\) 是否为 0,其採用的检定统计量为:
\(\displaystyle t=\frac{\overline{D}}{\sqrt{\frac{S^2_D}{n}}}\)
例如:研究者想要了解,肥胖国中男性运动半年后,其体重运动前后差值之均值是否有差异,因此从参加此计画的肥胖国中男性随机抽取 9 位,分别测量其运动前后体重,结果如表一:
\(\displaystyle \overline{D}=\frac{\sum^n_{i=1}d_i}{n}=(11+7+…+9)/9=8.67\)
\(\displaystyle S^2_D=\frac{\sum^n_{i=1}(d_i-\overline{D})^2}{n-1}=[(11-8.67)^2+…+(9-8.67)^2]/8=5.75\)
表一、国中男性运动半年后体重差值统计表。(本文作者黄纕淇製作)
编号运动前运动后差值172611127063738472124817011575705672639790846868608987789得到 \(\overline{D}\) 及 \(S^2_D\) 就可以计算 t 值,其为:
\(\displaystyle t=\frac{8.67-0}{\sqrt{\frac{5.75}{9}}}=10.85\)
想要知道在此条件下,8.67 小时的差异够不够显着?可以使用一个合理的临界值,如果此配对样本差值小于这个临界值,我们就认定配对样本差值之均值相同。此临界值通常选定为 \(t_{0.025,n-1}\)。在肥胖国中男性运动前后体重差值之均值例子中,由于 \(t = 10.85 >t_{0.025,8}= 2.306\),显示运动对于减重是有效的,因为运动前后体重差值之均值具有显着的差异。

图一、成对样本下两母群体平均值的假设检定。(本文作者黄纕淇製作)
参考文献
上一篇:两样本均值显着性检定(上)
下一篇:两根手指撕胶带,不用剪刀,方便又快速,学会很有用