在假设检验中, 测试统计 是 用来决定是否拒绝 空值 假设 或不。如果测试统计量在值范围内 称为接受区域,则原假设不被拒绝。的 接受区域的边界,即 空值不被拒绝的值称为临界值。
以下是正式定义。
定义
让
是
实数集的子集。假设
是一个检验统计量,因此原假设被拒绝
如果
并且不被拒绝
如果
哪里
是...的补充
.
如果
是一个间隔,则其极限称为临界值。
注意设置
在上面的定义中被称为测试的关键区域,而
补充
称为接受区域。
测试称为 一尾 如果只有一个关键
值
.
特别是有两种情况:
左尾检验:仅拒绝null
如果
右尾检验:只有在以下情况下才拒绝null
下表通过使用介绍的符号总结了两种情况
在定义中
以上。
通常,
选择以实现期望的
测试的大小.
请记住,大小是拒绝原假设的概率
当它是真的。用它来表示
.
对于左尾测试,我们
有
在
在大多数实际情况下,检验统计量是
连续随机
变量。因此,采取任何具体措施的可能性
值等于零。尤其是,
从而,
我们可以
写
哪里
是个 累积分布
功能 (cdf)测试统计信息。
为了确定临界值,我们要做的就是找到一个
解决了
方程
对于
最常见的分布,例如
正常
分配 和
t
分配,该方程没有解析解,因为反函数
的
CDF
是
封闭形式未知。但是,实际上任何计算器或统计数据
该软件具有预先构建的功能,可以轻松求解方程式
数值上。 (过时的)替代方法是查找关键值
在称为统计表的特殊表中。看到
这个
演讲 如果您想进一步了解这些替代方案。
右尾测试的情况相似。在这些测试中,我们
有
因此,我们必须解决
方程哪一个
完全按照左尾的情况求解(唯一的区别是我们
需要更换
与
)。
测试称为 两尾 如果有两个关键值
和
零假设仅被拒绝
如果
我们假设不失一般性地认为
.
因此,我们可以在上一个表格中添加新行
部分:
与单尾测试一样(见上文),在双尾测试中也是如此 选择临界值以达到预先定义的尺寸 测试。
大小可以计算为
如下:
通过再次假设检验统计量是连续随机数
变量,我们
获得哪里
是...的分布函数
.
我们的问题是在两个未知数中求解一个方程
(
和
)。
这个问题有潜在的无限解决方案,因为可以选择
随意选择两个关键值之一,然后选择其余一个,以便
解方程。没有一般的规则选择一个特定的
解。一种可能是尝试找到最大程度地提高解决方案的解决方案。
测试的力量 对应于
给定的 另类
假设。另一种可能性是找到最大化解决方案
接受间隔的长度
.
我们在这里不讨论这些可能性,但请读者参考Berger。
和Casella(2002)。相反,我们讨论测试统计量的情况
具有对称分布。这是实际中最相关的情况
因为在很多测试中
具有正态分布或学生t分布,这两个分布都是
对称的。
分布是对称的(大约为零)
什么时候对于
任何数字
.
我们可以通过以下两个假设来利用这一事实:
关键值是
对面:
不失一般性,我们可以
承担与
.
因此,可以写出测试的大小
如 和
要解决的方程式
变成
这是一个未知数的方程式
()
可以使用方法(数值反转,表格等)解决
在上一节中有关单尾测试的讨论。
我们到目前为止所说的一切总结如下
表。
如果您想阅读关于批判概念的更详细说明 价值和相关概念,请前往以 假设 测试.
Berger,R. L.和G. Casella(2002),“统计推断”,Duxbury Advanced 系列。
上一页条目: 协方差平稳
下一页条目: 互协方差矩阵
请引用为:
Taboga, Marco (2017). "临界值", 列克特ures on probability theory 和 mathematical statistics, Third edition. Kindle Direct Publishing. Online appendix. //www.junruiqiche.com/glossary/critical-value.