在Statlect上搜索概率和统计术语
统计列克特
指数 > 的基本原理 统计

集合估计

通过 博士

在统计推断中,采用样本对 从中生成样本的概率分布(请参见 演讲题目 统计 推理)。例子 $ xi $ 可以看作是一个 随机向量 $ Xi $, 谁的 联合分配 功能,表示为 [eq1], 未知,但是假定它属于一组分布函数 $菲$, 称为统计模型。

在参数模型中, $菲$ 与一套对应 [eq2]p尺寸 实向量。 $ Theta $ 称为参数空间,其元素称为参数。表示 通过 $ heta _ {0} $ 真实参数,即与未知参数关联的参数 分配功能 [eq3] 从哪个样本 $ xi $ 实际上是生成的。为了具体, $ heta _ {0} $ 假定是唯一的。本讲座讨论了有关 $ heta _ {0} $ 称为集合估计。

目录

置信集

大致说来, 集合估计 是选择一个 子集 $ T $ 参数空间 ($ Tsubseteq Theta $) 以这种方式 $ T $ 包含真实(和未知)参数的可能性很高 $ heta _ {0} $. 选择的子集 $ T $ 被称为 设定估计$ heta _ {0} $ 或一个 置信度 对于 $ heta _ {0} $.

当参数空间 $ Theta $ 是实数集的子集 R 和子集 $ T $ 从以下间隔中选择 R (例如,此类间隔 $ left [a,b
权] $), 我们谈论 区间估计 (而不是集合 估计), 区间估计 (而不是设定的估算值)和 置信区间 (而不是置信度)。

何时设定估算 $ T $ 使用关联一组的预定义规则(函数)生成 估计 $ T $ 每一个 $ xi $ 在里面 支持$ Xi $, 我们可以 写[eq4]

功能 [eq5] 被称为 估计量。通常,符号 $ T $ 用于表示集合估计和集合估计。意思是 通常从上下文中清除。

覆盖概率和 置信系数

正如我们已经说过的,集合估计是选择子集的行为 $ T $ 参数空间的方式 $ T $ 包含真实参数的可能性很高 $ heta _ {0} $. 的概率 $ T $ 包含真正的参数被称为 覆盖率 通常由统计学家选择。直观地观察之前 统计员发表的数据: [eq6]哪里 $ Theta $ 是参数空间,包含所有被视为的参数 有道理。统计学家认为该陈述是正确的,但 陈述不是很有益,因为 $ Theta $ 是一个非常大的集合。观察数据后,她提供了更多信息 声明:[eq7]这个 声明更具信息性,因为 $ T $ 小于 $ Theta $, 但却有可能出错(这是对 1 覆盖概率)。在控制这种可能性时, 统计学家面临一个权衡:如果她降低了 错误的话,她的陈述就没有那么多信息了;相反,如果她 增加了犯错的可能性,然后她的陈述变得更加 内容丰富。

用正式的术语来说,集合估算器的覆盖率定义为 如下:[eq8]哪里 符号 [eq9] 用于表示概率是使用 分配功能 [eq10] 与真实参数关联 $ heta _ {0} $. 重要的是要注意,在上述覆盖率定义中 随机数是区间 [eq11], 而参数是固定的。

在实践中,很少知道覆盖率,因为它取决于 未知参数 $ heta _ {0} $ (尽管在某些情况下,对于属于 参数空间)。当覆盖概率未知时,通常 计算 置信系数 [eq12], 定义为 如下:[eq13]在 换句话说,置信系数 [eq14] 等于最小可能的覆盖概率。信心 系数也常称为 信心水平.

置信集的大小

我们已经提到,在构造和选择上需要权衡 集合估计量一方面,我们需要我们的集合估计器 $ T $ 具有较高的覆盖率,也就是说,我们需要 $ T $ 包含真实参数的可能性很高。另一方面,我们 想要的大小 $ T $ 尽可能地小,以使我们的间隔估计更加精确。 我们所说的大小是什么意思 $ T $? 如果参数空间 $ Theta $ 是一维的 $ T $ 是一个区间估算值,则 $ T $ 只是它的长度。如果空间 $ Theta $ 是多维的,那么 $ T $ 是它的音量。的 置信集的大小 也称为 置信度的度量 (对于那些了解 测度理论,其名称源于勒贝格测度是 多维空间中的体积泛化)。如果我们用 [eq15] 置信集的大小,那么我们还可以定义 预期 集合估计量的大小 $ T $:[eq16]哪里 符号 [eq17] 用于表示期望值是使用 分配功能 [eq18] 与真实参数关联 $ heta _ {0} $. 与覆盖率一样,集合估计量的预期大小 取决于未知参数 $ heta _ {0} $. 因此,除非它是 $ heta _ {0} $, 一个人需要以某种方式估计它或对所有可能值进行最小化 参数的值,就像我们上面针对覆盖率所做的那样。

评估集合估计量的其他标准

尽管大小可能是评估和选择集合的最简单标准 估计量,还有其他几个标准。我们不在这里讨论它们,但是 我们请读者参考Berger,R.L。和G. Casella(2002),《统计推断》,达克斯伯里高级丛书。

例子

集合估计问题的示例可以在以下讲座中找到:

  1. 设定均值的估计 (示例 设定未知分布平均值的估计值);

  2. 设置方差估计 (对未知分布的方差进行集合估计的示例)。

如何引用

请引用为:

Taboga, Marco (2017). "集合估计", 列克特ures on probability theory and mathematical 统计, Third edition. Kindle Direct Publishing. Online appendix. //www.junruiqiche.com/fundamentals-of-statistics/set-estimation.

这本书

该网站上提供的大多数学习材料现在都以传统教科书格式提供。