在Statlect上搜索概率和统计术语
统计 列克特
指数 > 的基本原理 统计 > 假设检验

关于均值的假设检验

通过 博士

本讲座介绍了一些示例 假设检验, 专注于 关于均值的假设检验,即使用样本 进行关于未知分布平均值的假设检验。

目录

正常IID样本-已知方差

在此示例中,我们做出与set示例相同的假设 估计均值 组 均值估计-正常IID样本。读者强烈 建议在阅读此示例之前先阅读该示例。

例子

在此示例中,示例  $ xi _ {n} $ 由..制作 n 从一个独立抽签 正态分布 有 均值未知  亩 和已知方差  sigma ^ 2 . 具体来说,我们观察 n 实现  $ x_ {1} $ , ...,  $ x_ {n} $ n 独立随机变量 X_1, ...,  X_n , 全部具有正态分布,均值未知  亩 和已知方差  sigma ^ 2 . 样本是 n尺寸 向量 [eq1], 这是实现 随机向量 [eq2].

零假设

我们测试 零假设 那 均值  亩 等于特定值  $  亩  _ {0} $ :[eq3]

替代假设

我们假设 参数 空间 是整个真实的线,即 U {211d} $中的$  亩 . 因此, 另类 假设 [eq4]

测试统计

构造一个 测试统计 ,我们 使用样本 意思 [eq5]

测试统计 是 [eq6] 这个 测试统计量通常称为 统计量 要么 正常 统计量 基于这个统计量的假设检验是 叫 Z检验 要么 正常Z检验.

关键区域

[eq7]. 我们拒绝原假设  $ H_ {0} $ 如果 $ Z_ {n}>z$ 或者如果 $ Z_ {n}<-z$. 换句话说, 危急 地区 [eq8] 从而, 的 临界值 测试的 是  $ -z $  $ z $ .

幂函数

幂函数 测试的 是 [eq9] 哪里 Z 是一个 标准正态随机变量 和 符号 $ QTR {rm} {P} _ {mu} $ 是 用于表示以下事实:拒绝null的概率 假设是在真实均值等于  亩 .

证明

幂函数可以写 如 [eq10] 哪里 我们有 定义的 [eq11] 如 在名为“ 点 均值估计,样本均值  Xbar_n 具有均值的正态分布  亩 和方差 $ sigma ^ {2} / n $, 给定样本的假设  $ xi _ {n} $ 我们在上面做了。从中减去正常随机变量的均值 随机变量本身,然后将其除以其方差的平方根, 获得标准的正常随机变量。因此,变量 Z 具有标准正态分布。

测试的大小

当时评估 $  亩  =  亩  _ {0} $, 幂函数等于提交a的概率 类型I错误,即概率 在原假设为真时拒绝原假设的过程。这个 概率称为 的大小 测试 它等于 [eq12] 哪里 Z 是标准的正常随机变量(通过 替代  亩  $  亩  _ {0} $ 在上面的幂函数的公式中)。

正常的IID样本-未知方差

此示例与上一个示例相似。唯一的区别是我们 现在放宽关于分布方差已知的假设。

例子

在此示例中,示例  $ xi _ {n} $ 由..制作 n 从均值未知的正态分布中独立提取  亩 和未知方差  sigma ^ 2 . 具体来说,我们观察 n 实现  $ x_ {1} $ , ...,  $ x_ {n} $ n 独立随机变量 X_1, ...,  X_n , 全部具有正态分布,均值未知  亩 和未知方差  sigma ^ 2 . 样本是 n尺寸 向量 [eq13], 这是随机向量的实现 [eq2].

零假设

我们检验零假设,即均值  亩 等于特定值  $  亩  _ {0} $ :[eq3]

替代假设

我们假设参数空间是整个实线,即 U {211d} $中的$  亩 . 因此,替代假设 是 [eq16]

测试统计

通过使用样本,我们构造了两个检验统计量 意思 [eq5] 和 要么 未经调整 样品 方差 [eq18] 要么 的 调整样本 方差 [eq19]

两次测试统计 是 [eq20] 哪里 上标  $ u $ a 指示测试统计是基于未调整还是已调整 样本方差。这两个测试统计数据通常称为 统计量 要么 学生的t统计 和 基于这些统计数据的假设检验称为 t检验 要么 学生的t检验.

关键区域

[eq7]. 我们拒绝原假设  $ H_ {0} $ 如果 $ Z_ {n} ^ {i}>z$ 或者如果 $ Z_ {n} ^ {i}<-z$ (对于  $ i = u $ 要么  $ i = a $ )。 换句话说, 危急 地区 [eq22] 从而, 测试的关键值是  $ -z $  $ z $ .

幂函数

基于未经调整的样本方差的检验的功效函数 是 [eq23] 哪里 符号 $ QTR {rm} {P} _ {mu} $ 是 用于表示以下事实:拒绝null的概率 假设是在真实均值等于  亩  $ W_ {n-1} $ 是一个 非中央标准学生 分配$n-1$ 自由度和非中心参数相等 至 [eq24]

证明

幂函数可以写 如 [eq25] 哪里 我们有 定义的 [eq26] 给定 样本上的假设  $ xi _ {n} $ 我们在上面做了,样本均值  Xbar_n 具有均值的正态分布  亩 和方差 $ sigma ^ {2} / n $ (看到 均值点估计 ),所以 那随机 变量 [eq27] 具有 标准正态分布。此外,未经调整的样本方差 $ S_ {n} ^ {2} $ 有一个 伽玛分布 带参数 $n-1$[eq28] (看到 方差的点估计 ), 这样随机 变量 [eq29] 具有 具有参数的Gamma分布 $n-1$1. 加一个常数  $ c $ 到标准正态分布,然后将得到的总和除以 具有参数的Gamma随机变量的平方根 $n-1$1, 一个非中心标准的学生t分布 $n-1$ 自由度和非中心度参数  $ c $ . 因此,随机变量  $ W_ {n-1} $ 具有非中央标准的学生t分布 $n-1$ 自由度和非中心度 参数 [eq30]

基于调整后的样本方差的检验功效函数 是 [eq31] 哪里 符号 $ QTR {rm} {P} _ {mu} $ 是 用于表示以下事实:拒绝null的概率 假设是在真实均值等于  亩  $ W_ {n-1} $ 是非中央标准学生t分布 $n-1$ 自由度和非中心参数相等 至 [eq32]

证明

幂函数可以写 如 [eq33] 哪里 我们有 定义的 [eq34] 给定 样本上的假设  $ xi _ {n} $ 我们在上面做了,样本均值  Xbar_n 具有均值的正态分布  亩 和方差 $ sigma ^ {2} / n $ (看到 均值点估计 ),所以 那随机 变量 [eq27] 具有 标准正态分布。此外,调整后的样本方差 $ s_ {n} ^ {2} $ 具有带有参数的Gamma分布 $n-1$ sigma ^ 2 (看到 方差的点估计 ), 这样随机 变量 [eq36] 具有 具有参数的Gamma分布 $n-1$1. 加一个常数  $ c $ 到标准正态分布,然后将得到的总和除以 具有参数的Gamma随机变量的平方根 $n-1$1, 一个非中心标准的学生t分布 $n-1$ 自由度和非中心度参数  $ c $ . 因此,随机变量  $ W_ {n-1} $ 具有非中央标准的学生t分布 $n-1$ 自由度和非中心度 参数 [eq30]

注意,对于固定  $ z $ , 基于未经调整的样本方差的检验比 根据调整后的样本方差进行检验 即 [eq38] 因为 [eq39] 和, 作为一个 后果[eq40]

测试的大小

基于未经调整的样本方差的检验大小等于 [eq41] 哪里  $ W_ {n-1} $ 是一个 标准学生t分布$n-1$ 自由程度。

证明

当时评估 $  亩  =  亩  _ {0} $, 幂函数等于测试的大小,即 发生I型错误。功效评估为  $  亩  _ {0} $ [eq41] 哪里  $ W_ {n-1} $ 是非中央标准学生t分布 $n-1$ 自由度和非中心参数相等 至 [eq43] 因此, 什么时候 $  亩  =  亩  _ {0} $, 非中心参数等于 0 $ W_ {n-1} $ 只是标准的学生t分布。

基于调整后的样本方差的检验大小等于 [eq44] 哪里  $ W_ {n-1} $ 是标准的学生t分布 $n-1$ 自由程度。

证明

当时评估 $  亩  =  亩  _ {0} $, 幂函数等于测试的大小,即 发生I型错误。功效评估为  $  亩  _ {0} $ [eq45] 哪里  $ W_ {n-1} $ 是非中央标准学生t分布 $n-1$ 自由度和非中心参数相等 至 [eq43] 因此, 什么时候 $  亩  =  亩  _ {0} $, 非中心参数等于 0 $ W_ {n-1} $ 只是标准的学生t分布。

注意,对于固定  $ z $ , 基于未经调整的样本方差的检验的大小大于 根据调整后的样本方差进行检验,因为如上所述, 对于真值的任何值,前者也具有比后者更大的力量 参数  亩 .

解决的练习

您可以在下面找到一些练习,其中包含已说明的解决方案。

练习1

表示为 [eq47] 分配功能 的非中央标准学生t分布 n 自由度和非中心度参数等于 k. 假设统计学家观察 $100$ 正常随机变量的独立实现。均值和 统计人员不知道的随机变量的方差是 等于 1$4$ 分别。是什么 可能性,以 条件 [eq48], 统计员会拒绝 零假设 意思是 如果她根据 $100$ 她观察到的实现 $z=2$ 作为临界值,她使用调整后的样本方差来计算 t统计量?

拒绝空值的可能性 假设 $  亩  _ {0} = 0 $ 通过评估测试的幂函数获得  $  亩  = 1 $ :[eq49] 哪里 符号 $ QTR {rm} {P} _ {mu} $ 是 用于表示以下事实:拒绝null的概率 假设是在真实均值等于  $  亩  = 1 $ , 和  $ W_ {99} $ 是非中央标准学生t分布 $99$ 自由度和非中心度 参数 [eq50] 从而, 否定原假设的概率相等 至 [eq51]

练习2

表示为 [eq52] 标准学生t分布的分布函数 n 自由度 [eq53] 相反。假设统计学家遵守 $100$ 随机变量的独立实现,她执行 变量均值等于零的零假设的t检验, 根据 $100$ 观察到的实现,并使用未经调整的样本方差来计算 t统计量。她应该使用什么临界值才能产生类型 我有10%的概率出错吗?用以下方式表达 [eq54].

当null时,将发生I型错误 假设是正确的,但被拒绝了。拒绝空值的可能性 假设 $  亩  _ {0} = 0 $[eq55] 哪里  $ z $ 是关键值,并且  $ W_ {99} $ 是标准的学生t分布 $99$ 自由程度。这个概率可以表示 如 [eq56] 哪里: 在步  $ box {A} $ 我们使用了一个事实,即标准学生t分布的密度 围绕零对称。因此,我们需要设置  $ z $ 以这样的方式 那 [eq57] 这个 完成 通过 [eq58]

如何引用

请引用为:

Taboga, Marco (2017). "关于均值的假设检验", 列克特 ures on 可能性 的 要么 y 和 mathematical 统计, Third edition. Kindle Direct Publishing. Online appendix. //www.junruiqiche.com/fundamentals-of-statistics/hypothesis-testing-mean.

这本书

该网站上提供的大多数学习材料现在都以传统教科书格式提供。