在Statlect上搜索概率和统计术语
统计列克特
指数 > 的基本原理 统计

真人在线斗地主检验

通过 博士

真人在线斗地主检验是一种通过以下方法进行统计推断的方法 建立一个真人在线斗地主,称为零真人在线斗地主,并使用一些数据 决定是否拒绝该真人在线斗地主。

目录

零真人在线斗地主

正如我们在名为“ 统计推断,统计 推论是关于概率分布的陈述, 样品 $ xi $ 已被绘制。例子 $ xi $ 可以看作是一个 rom矢量 $ Xi $, 谁不明 联合 分配功能 [eq1] 假定属于一组分布函数 $菲$, 称为统计模型。

真人在线斗地主检验 我们发表关于模型的声明 涉及子集的限制 [eq2] 原始模型的我们做出的陈述是在两个可能的选择中选择的 声明:

  1. 拒绝限制 [eq3];

  2. 不要拒绝限制 [eq3].

粗略地说,我们从大范围开始 $菲$ 可能已经产生样本的分布 $ xi $ 我们希望将注意力集中在较小的一组 $ Phi _ {R} $. 在真人在线斗地主检验中,我们使用样本 $ xi $ 决定是否确实将我们的注意力限制在较小的集合上 $ Phi _ {R} $.

如果我们有一个参数模型,我们也可以对 真人在线斗地主。

请记住,在参数模型中,分布函数集 $菲$ 与一套对应 [eq5]p尺寸 实向量称为 参数 空间。的要素 $  的 ta $ 被称为 参数 真实的 参数表示为 $ heta _ {0} $. true参数是与未知分布关联的参数 功能 [eq6] 从哪个样本 $ xi $ 实际被绘制。为简单起见, $ heta _ {0} $ 假定是唯一的。

在参数真人在线斗地主检验中,我们有一个限制 [eq7] 在参数空间上,我们选择以下两个语句之一: 限制:

  1. 拒绝限制 [eq8];

  2. 不要拒绝限制 [eq8].

为了具体起见,在此我们将集中于参数真人在线斗地主检验 讲座,但是我们要说的大多数内容都非常简单 总体上对真人在线斗地主检验的修改。

限制为真的真人在线斗地主称为 空值 真人在线斗地主 通常用 $ H_ {0} $:

[eq10]

替代真人在线斗地主

限制条件 [eq11] (哪里 $  的 ta _ {R} ^ {c} $ 是...的补充 $  的 ta _ {R} $) 通常被称为 替代真人在线斗地主 它由 $ H_ {1} $:[eq12]

对于某些作者,“拒绝原真人在线斗地主 $ H_ {0} $" “接受替代真人在线斗地主 $ H_ {1} $" 是同义词。但是,对于其他作者,“拒绝原真人在线斗地主 $ H_ {0} $" 不一定意味着“接受替代真人在线斗地主 $ H_ {1} $ ”。 尽管这主要是语言问题,但可以设想 拒绝后的情况 $ H_ {0} $, 进行第二次真人在线斗地主检验,从而 $ H_ {1} $ 成为新的原真人在线斗地主并被拒绝(这种情况可能发生在 如果模型是 错误指定)。在这些 情况下,如果“拒绝原真人在线斗地主” $ H_ {0} $" “接受替代真人在线斗地主 $ H_ {1} $" 被当作​​同义词,那么会引起一些混乱,因为第一个测试 导致“接受 $ H_ {1} $" 第二项测试导致“拒绝 $ H_ {1} $ ”。

另请注意,某些统计学家有时会将 替代真人在线斗地主的集合小于 $  的 ta _ {R} ^ {c} $. 在这些情况下,原真人在线斗地主和替代真人在线斗地主不存在 涵盖参数空间考虑的所有可能性 $  的 ta $.

错误类型

当我们决定是否拒绝限制时,我们可以 导致两种类型的错误:

  1. 拒绝限制 [eq8] 当限制为真时;这称为 第一个错误 类 或一个 类型I错误;

  2. 不要拒绝限制 [eq8] 当限制为假时;这称为 秒的错误 类 或一个 II型错误.

关键区域

记住样品 $ xi $ 被视为rom向量的实现 $ Xi $ 有支持 $ R_ {Xi} $.

真人在线斗地主检验通常通过显式或隐式进行 细分支持 $ R_ {Xi} $ 分为两个不相交的子集。两个子集之一,用表示 $ C_ {Xi} $ 被称为 关键区域 (要么 拒绝 地区)它是的所有值的集合 $ xi $ 原真人在线斗地主为 拒绝:[eq15] 的 其他子集只是关键的补充 地区:[eq16]和 当然是这样 那[eq17]

测试统计

通常根据测试统计量隐式定义关键区域 测试统计数据的关键区域。一种 测试 统计 是一个 只读变量 $ S $ 其实现取决于样本 $ xi $. 在 符号[eq18]

关键区域 $ S $ 是一个子集 [eq19] 实数集,然后根据测试执行测试 统计 如下:[eq20]

如果关键区域的互补 $ C_ {S} $ 是一个间隔,那么它的极端称为 危急 价值观 测试。看到 此词汇表条目 更多细节 关于临界值。

电源功能

幂函数 真人在线斗地主检验的功能是 关联拒绝的可能性 $ H_ {0} $ 每个参数 $ theta中的$. 用以下方式表示关键区域 $ C_ {Xi} $, 幂函数 [eq21] 被定义为 如下:[eq22]哪里 符号 [eq23] 用于表示概率是使用 分配功能 [eq24] 与参数关联 $ heta $.

测试大小

什么时候 [eq25], 幂函数 [eq26] 告诉我们犯I型错误的可能性,即 当原真人在线斗地主为真时,拒绝原真人在线斗地主。最大值 犯I型错误的可能性是 因此,[eq27]这个 最大概率称为 测试的大小。尺寸 一些作者还称该测试为 重要程度 测试的。但是,根据其他作者,他们分配了一个 术语的含义略有不同,测试的显着性水平是 测试大小的上限,即一个常数 $ lpha $ 就统计学家所知, 满足[eq28]

评估测试的标准

真人在线斗地主检验最常根据其大小和功效进行评估。 理想测试的大小应等于 0 (即,当null为零时,拒绝null真人在线斗地主的概率 真人在线斗地主是真的应该是 0) 功率等于 1 什么时候 [eq29] (即,当无效值为零时拒绝无效真人在线斗地主的概率 假说应该是假的 1 )。 当然,这种理想的测试在实践中从来没有发现,但是我们可以做到最好 希望的是一种具有很小尺寸和很高概率的测试 拒绝错误的真人在线斗地主。然而,这种理想习惯上被用来 在不同测试之间选择:例如,在两个测试之间选择 具有相同的尺寸,我们将始终利用具有较高尺寸的测试 通电时 [eq30]; 同样,当在两个具有相同功效的测试之间进行选择时 [eq31], 我们将始终利用尺寸较小的测试。

除功效和尺寸外,还有其他几个标准可用于评估 真人在线斗地主。我们在这里不讨论它们,但是我们请读者参考 Berger Casella(2002)中的精彩展览。

例子

在以下讲座中可以找到真人在线斗地主检验的例子:

  1. 关于均值的真人在线斗地主检验 (关于未知分布平均值的真人在线斗地主检验示例);

  2. 真人在线斗地主 关于方差的检验 (关于 未知分布的方差)。

参考文献

Berger,R. L.和G. Casella(2002),“统计推断”,Duxbury Advanced 系列。

如何引用

请引用为:

Taboga, Marco (2017). "真人在线斗地主检验", 列克特ures on probability theory 和 mathematical 统计, Third edition. Kindle Direct Publishing. Online appendix. //www.junruiqiche.com/fundamentals-of-statistics/hypothesis-testing.

这本书

该网站上提供的大多数学习材料现在都以传统教科书格式提供。