在Statlect上搜索概率和统计术语
统计列克特
指数 > 的基本原理 统计 > 集合估计

设定均值的估计

通过 博士

本讲座介绍了一些示例 组 估算 问题,专注于 设定 意思,即使用样本产生对 未知分布的平均值。

目录

正常IID样本-已知方差

在此示例中,我们做出的假设与我们在 均值的点估计示例 均值估算-正常IID样本. 在阅读此示例之前先阅读该示例将是有益的。

例子

在此示例中,示例 $ xi _ {n} $ 由..制作 n 从一个独立抽签 正态分布 有 均值未知 亩 和已知方差 sigma ^ 2. 具体来说,我们观察 n 实现 $ x_ {1} $, ..., $ x_ {n} $n 独立随机变量 X_1, ..., X_n, 全部具有正态分布,均值未知 亩 和已知方差 sigma ^ 2. 样本是 n尺寸 向量 [eq1] 这是实现 随机向量 [eq2]

间隔估计器

构造一个 区间估计器 均值 亩, 我们使用 样品 意思[eq3]

间隔估计器 是[eq4]哪里 [eq5] 是严格的正常数。

覆盖率

覆盖率 的 区间估计器 $ T_ {n} $[eq6]哪里 Z 是一个 标准正态随机变量.

证明

覆盖概率可以写成 如 [eq7]哪里 我们有 定义的[eq8]在 演讲题目 的点估计 意思,我们已经证明,鉴于样本的假设 $ xi _ {n} $ 如上所述,样本均值 Xbar_n 具有均值的正态分布 亩 和方差 $ sigma ^ {2} / n $. 从随机变量中减去正常随机变量的均值 本身,然后将其除以其方差的平方根,便得到一个 标准正态随机变量。因此,变量 Z 具有标准正态分布。

置信系数

注意,覆盖概率不取决于未知参数 亩. 因此, 置信度 系数 间隔估计量 $ T_ {n} $ 与其覆盖范围一致 可能性:[eq9]哪里 Z 是标准的正常随机变量。

尺寸

间隔估计器的大小 $ T_ {n} $[eq10]

预期大小

请注意,大小不取决于样本 $ xi _ {n} $. 因此, 预期大小[eq11]

正常的IID样本-未知方差

此示例与上一个示例相似。唯一的区别是我们 现在放宽关于分布方差已知的假设。

例子

在此示例中,示例 $ xi _ {n} $ 由..制作 n 从均值未知的正态分布中独立提取 亩 和未知方差 sigma ^ 2. 具体来说,我们观察 n 实现 $ x_ {1} $, ..., $ x_ {n} $n 独立随机变量 X_1, ..., X_n, 全部具有正态分布,均值未知 亩 和未知方差 sigma ^ 2. 的 样品 是个 n尺寸 向量 [eq12], 这是随机向量的实现 [eq13].

间隔估计器

构造均值的区间估计量 亩, 我们使用样本 意思[eq14]

未经调整 样品 方差[eq15]

或者 调整样本 方差[eq16]我们 考虑两个区间估计 意思:[eq17]哪里 [eq5] 是一个严格的正常数和上标 $ u $a 指示估算器是基于未调整的还是已调整的 样本方差。

覆盖率

区间估计器的覆盖概率 $ T_ {n} ^ {u} $[eq19]哪里 $ Z_ {n-1} $ 是一个 标准学生t随机变量 $n-1$ 自由程度。

证明

覆盖概率可以写成 如 [eq20]哪里 我们有 定义的[eq21]现在, 改写 $ Z_ {n-1} $[eq22]哪里 我们有 定义的[eq23]和 我们使用了这样一个事实,即未经调整的样本方差可以表示为 调整后的样本方差的函数为 如下:[eq24]在 演讲题目 的点估计 方差,我们已经证明,鉴于样本的假设 $ xi _ {n} $ 如上所述,调整后的样本方差 $ s_ {n} ^ {2} $ 有一个 伽玛分布 带参数 $n-1$sigma ^ 2. 因此,随机变量 $ W $ 具有带有参数的Gamma分布 $n-1$1. 而且,随机变量 Y 具有标准正态分布(请参阅上一节)。因此, $ Z_ {n-1} $ 是标准正态随机变量与的平方根之间的比率 具有参数的Gamma随机变量 $n-1$1. 作为结果, $ Z_ {n-1} $ 具有标准的学生t分布 $n-1$ 自由度(请参阅标题为“ 学生们 t分布 以证明这一事实)。

区间估计器的覆盖概率 $ T_ {n} ^ {a} $[eq25]哪里 $ Z_ {n-1} $ 是标准的学生t随机变量, $n-1$ 自由程度。

证明

覆盖率可以写成 [eq26]哪里 我们有 定义的[eq27]现在, 改写 $ Z_ {n-1} $[eq28]哪里 我们有 定义:[eq23]在 演讲题目 的点估计 方差,我们已经证明,鉴于样本的假设 $ xi _ {n} $ 如上所述,调整后的样本方差 $ s_ {n} ^ {2} $ 具有带有参数的Gamma分布 $n-1$sigma ^ 2. 因此,随机变量 $ W $ 具有带有参数的Gamma分布 $n-1$1. 而且,随机变量 Y 具有标准正态分布(请参阅上一节)。因此, $ Z_ {n-1} $ 是标准正态随机变量与的平方根之间的比率 具有参数的Gamma随机变量 $n-1$1. 作为结果, $ Z_ {n-1} $ 具有标准的学生t分布 $n-1$ 自由度(请参阅标题为“ 学生们 t分布 以证明这一事实)。

注意,置信区间的覆盖概率基于 未经调整的样本方差 $ S_ {n} ^ {2} $ 小于基于的置信区间的覆盖概率 调整后的样本方差 $ s_ {n} ^ {2} $ 因为[eq30]和, 作为一个 后果[eq31]

置信系数

注意两者的覆盖率 $ T_ {n} ^ {u} $$ T_ {n} ^ {a} $ 不依赖于未知参数 亩sigma ^ 2. 因此, 置信度 系数 两个置信区间中的一个与相应的 覆盖范围 概率:[eq32]哪里 $ Z_ {n-1} $ 具有标准的学生t分布 $n-1$ 自由程度。

尺寸

置信区间的大小 $ T_ {n} ^ {u} $[eq33]而 置信区间的大小 $ T_ {n} ^ {a} $[eq34]

注意,置信区间的大小基于未经调整的样本 方差 $ S_ {n} ^ {2} $ 小于基于调整后的置信区间的大小 样本方差 $ s_ {n} ^ {2} $ 因为[eq35]和, 作为一个 后果,[eq36]

因此,基于未调整样本方差的置信区间具有 较小的尺寸和较小的覆盖概率。正如我们在 演讲题目 集合估计, 选择 的集合估算器通常受获得最高估计量的原理的启发 给定大小或最小可能大小的可能覆盖概率 对于给定的覆盖率。遵循这个原则,没有明确的 基于未调整样本方差的估计量与 估计值基于调整后的样本方差,因为前者具有 尺寸较小,但后者具有较高的覆盖概率。

预期大小

预期大小$ T_ {n} ^ {u} $[eq37]哪里 [eq38] 是个 伽玛功能.

证明

我们需要利用以下事实 $ S_ {n} ^ {2} $ 具有带有参数的Gamma分布 $n-1$[eq39]. 为了简化表示法, 组[eq40]的 的概率密度函数 X[eq41]哪里 $ c $ 是一个 不变:[eq42][eq38] 是Gamma函数。 因此,[eq44]哪里 我们有 定义的[eq45]和 我们已经利用了事实 那[eq46]因为 它是带有参数的Gamma随机变量的密度的积分 nsigma ^ 2 在其支持和概率密度集成到 1. 从而,[eq47]

预期大小$ T_ {n} ^ {a} $[eq48]哪里 [eq38] 是Gamma函数。

证明

使用事实 那[eq50]我们 获得[eq51]

解决的练习

您可以在下面找到一些练习,其中包含已说明的解决方案。

练习1

假设您观察到一个 $100$ 从一个独立抽签 正态分布 有 均值未知 亩 和已知方差 $ sigma ^ {2} = 1 $. 表示 $100$ 吸引 X_1, ..., $ X_ {100} $. 假设他们的样本均值 $ overline {X} _ {100} $ 等于 1, 那 是的[eq52]

找出一个置信区间 亩, 使用的集合估计量 亩$90%$ 覆盖率。

对于给定的样本量 n, 间隔 估计量[eq4]具有 覆盖范围 可能性[eq54]哪里 Z 是标准的正常随机变量,并且 [eq5] 是严格的正常数。因此,我们需要找到 $ z $ 这样 那[eq56][eq57]哪里 最后一个等式源于一个事实,即标准正态分布为 围绕零对称。因此 $ z $ 一定是这样 那[eq58]要么[eq59]使用 正态分布表或计算机程序来查找值 $ z $ (请参阅标题为“ 正常 分布-价值观),我们 获得[eq60]从而, 的置信区间 亩[eq61]

练习2

假设您观察到一个 $100$ 从均值未知的正态分布中独立提取 亩 和未知方差 sigma ^ 2. 表示 $100$ 吸引 X_1, ..., $ X_ {100} $. 假设他们的样本均值 $ overline {X} _ {100} $ 等于 1, 即:[eq62]和 他们调整后的样本方差 $ s_ {100} ^ {2} $ 等于 $4$, 那 是的[eq63]

找出一个置信区间 亩, 使用的集合估计量 亩$99%$ 覆盖率。

对于给定的样本量 n, 间隔 估计量[eq64]具有 覆盖范围 可能性[eq65]哪里 $ Z_ {n-1} $ 是一个 标准学生t随机变量 $n-1$ 自由度和 [eq5] 是严格的正常数。因此,我们需要找到 $ z $ 这样 那[eq67][eq57]哪里 最后的平等源于以下事实:标准学生的 分布在零附近对称。因此 $ z $ 一定是这样 那[eq69]要么:[eq70]使用 寻找价值的计算机程序 $ z $ (for example, 与 the MATLAB command tinv(0.995,99)), 我们 获得[eq71]从而, 的置信区间 亩[eq72]

如何引用

请引用为:

Taboga, Marco (2017). "设定均值的估计", 列克特ures on 可能性 theory 和 mathematical 统计, Third edition. Kindle Direct Publishing. Online appendix. //www.junruiqiche.com/fundamentals-of-statistics/set-estimation-mean.

这本书

该网站上提供的大多数学习材料现在都以传统教科书格式提供。