在统计推断中,采用样本对
从中生成样本的概率分布(请参见
演讲题目 统计
推理)。例子
可以看作是一个
随机向量
,
谁的 联合分配
功能,表示为
,
未知,但是假定它属于一组分布函数
,
称为统计模型。
在参数模型中,
与一套对应
的
尺寸
实向量。
称为参数空间,其元素称为参数。表示
通过
真实参数,即与未知参数关联的参数
分配功能
从哪个样本
实际上是生成的。为了具体,
假定是唯一的。本讲座讨论了有关
称为集合估计。
大致说来, 集合估计 是选择一个
子集
参数空间
(
)
以这种方式
包含真实(和未知)参数的可能性很高
.
选择的子集
被称为 设定估计 的
或一个 置信度 对于
.
当参数空间
是实数集的子集
和子集
从以下间隔中选择
(例如,此类间隔
),
我们谈论 区间估计 (而不是集合
估计), 区间估计 (而不是设定的估算值)和
置信区间 (而不是置信度)。
何时设定估算
使用关联一组的预定义规则(函数)生成
估计
每一个
在里面 支持 的
,
我们可以
写
功能
被称为 组 估计量。通常,符号
用于表示集合估计和集合估计。意思是
通常从上下文中清除。
正如我们已经说过的,集合估计是选择子集的行为
参数空间的方式
包含真实参数的可能性很高
.
的概率
包含真正的参数被称为 覆盖率
通常由统计学家选择。直观地观察之前
统计员发表的数据:
哪里
是参数空间,包含所有被视为的参数
有道理。统计学家认为该陈述是正确的,但
陈述不是很有益,因为
是一个非常大的集合。观察数据后,她提供了更多信息
声明:
这个
声明更具信息性,因为
小于
,
但却有可能出错(这是对
覆盖概率)。在控制这种可能性时,
统计学家面临一个权衡:如果她降低了
错误的话,她的陈述就没有那么多信息了;相反,如果她
增加了犯错的可能性,然后她的陈述变得更加
内容丰富。
用正式的术语来说,集合估算器的覆盖率定义为
如下:哪里
符号
用于表示概率是使用
分配功能
与真实参数关联
.
重要的是要注意,在上述覆盖率定义中
随机数是区间
,
而参数是固定的。
在实践中,很少知道覆盖率,因为它取决于
未知参数
(尽管在某些情况下,对于属于
参数空间)。当覆盖概率未知时,通常
计算 置信系数
,
定义为
如下:
在
换句话说,置信系数
等于最小可能的覆盖概率。信心
系数也常称为 信心水平.
我们已经提到,在构造和选择上需要权衡
集合估计量一方面,我们需要我们的集合估计器
具有较高的覆盖率,也就是说,我们需要
包含真实参数的可能性很高。另一方面,我们
想要的大小
尽可能地小,以使我们的间隔估计更加精确。
我们所说的大小是什么意思
?
如果参数空间
是一维的
是一个区间估算值,则
只是它的长度。如果空间
是多维的,那么
是它的音量。的 置信集的大小 也称为
置信度的度量 (对于那些了解
测度理论,其名称源于勒贝格测度是
多维空间中的体积泛化)。如果我们用
置信集的大小,那么我们还可以定义 预期
集合估计量的大小
:
哪里
符号
用于表示期望值是使用
分配功能
与真实参数关联
.
与覆盖率一样,集合估计量的预期大小
取决于未知参数
.
因此,除非它是
,
一个人需要以某种方式估计它或对所有可能值进行最小化
参数的值,就像我们上面针对覆盖率所做的那样。
尽管大小可能是评估和选择集合的最简单标准 估计量,还有其他几个标准。我们不在这里讨论它们,但是 我们请读者参考Berger,R.L。和G. Casella(2002),《统计推断》,达克斯伯里高级丛书。
集合估计问题的示例可以在以下讲座中找到:
请引用为:
Taboga, Marco (2017). "集合估计", 列克特ures on probability theory and mathematical 统计, Third edition. Kindle Direct Publishing. Online appendix. //www.junruiqiche.com/fundamentals-of-statistics/set-estimation.