在Statlect上搜索概率和统计术语
统计列克特
指数 > 的基本原理 统计

统计推断

通过 博士

统计推断是使用观察到的数据推断未知的行为 概率分布的性质和特征 观察到的数据已经生成。用于制作的数据集 推论称为样本。

目录

样品

在最简单的情况下,我们观察到 实现 $ x_ {1} $, ..., $ x_ {n} $n 独立随机变量 X_1, ..., X_n 有共同点 分配 功能 [eq1] 我们使用观察到的实现来推断 [eq2]. 稍微滥用语言,我们有时会说 "n 随机变量的独立实现 X" 而不是说“ n 独立随机变量 X_1, ..., X_n 具有共同的分配功能 [eq3]”。

某种类型的电子设备的寿命是随机变量 X, 其分布函数 [eq2] 未知。假设我们独立观察 $10$ 组件。用以下方式表示这些实现 $ x_ {1} $, $ x_ {2} $, ..., $ x_ {10} $. 我们对...的期望值感兴趣 X, 这是一个未知的特征 [eq5]. 我们推断 [eq6] 根据数据进行估算 [eq6] 与样品 意思[eq8]在 这个简单的例子观察到的数据 $ x_ {1} $, $ x_ {2} $, ..., $ x_ {10} $ 构成我们的样本 [eq6] 是我们要进行统计推断的数量。

而在最简单的情况下 X_1, ..., X_n 是独立的随机变量,更复杂的情况是可能的。对于 例:

  1. X_1, ..., X_n 不独立;

  2. X_1, ..., X_n 随机向量 有共同点 联合分配 功能 [eq2];

  3. X_1, ..., X_n 没有共同的概率分布。

是否有样本的定义来概括所有 以上特殊情况?幸运的是,它非常简单。

定义 A 样品 $ xi $ 是随机向量的实现 $ Xi $.

的分布函数 $ Xi $, 表示为 [eq11], 是构成推断对象的未知分布函数。

因此,“样本”仅是“实现随机向量”的同义词。的 以下示例显示了此一般定义如何适应特殊情况 上述案例。

当我们观察 n 实现 $ x_ {1} $, ..., $ x_ {n} $n 独立随机变量 X_1, ..., X_n 具有共同的分配功能 [eq2], 样本是 n尺寸 向量 [eq13], 这是随机向量的实现 [eq14]. 的联合分布函数 $ Xi $[eq15]

当我们观察 n 实现 $ x_ {1} $, ..., $ x_ {n} $n 随机变量 X_1, ..., X_n 不是独立的而是具有共同的分配功能 [eq2], 样本又是 n尺寸 向量 [eq17], 这是随机向量的实现 [eq18]. 但是,在这种情况下,联合分配函数 [eq19] 不能再写成的分布函数的乘积 X_1, ..., X_n.

当我们观察 n 实现 $ x_ {1} $, ..., $ x_ {n} $n 独立 K尺寸 随机向量 X_1, ..., X_n 具有共同的关节分布功能 [eq2], 样本是 $ nK $尺寸 向量 [eq21], 这是随机向量的实现 [eq22]. 的联合分布函数 $ Xi $[eq15]

当我们观察 n 实现 $ x_ {1} $, ..., $ x_ {n} $n 独立 K尺寸 随机向量 X_1, ..., X_n 具有不同的联合分配功能 [eq24], ..., [eq25], 样本是 $ nK $尺寸 向量 [eq26], 这是随机向量的实现 [eq14]. 的联合分布函数 $ Xi $[eq28]

由样品制成 n 实现 $ x_ {1} $, ..., $ x_ {n} $n 随机变量(或随机 向量):[eq29]然后 我们说样本有 尺寸 n (或 样本量n)。 个人实现 $ x_ {i} $ 被称为 观察 从样本。

统计模型

在上一节中,我们定义了一个示例 $ xi $ 作为随机向量的实现 $ Xi $ 具有联合分配功能 [eq30]. 例子 $ xi $ 用于推断 [eq31] 统计人员还不完全了解。属性和 特点 [eq19] 观察之前已知的(或假定已知的) 样本被称为模型 $ Xi $. 用数学术语来说, $ Xi $ 是一组联合分配函数, [eq19] 被认为属于。

定义 让样品 $ xi $ 实现一个 $ l $维随机 向量 $ Xi $ 具有联合分配功能 [eq19]. 让 $ Psi $ 成为所有人的集合 $ l $尺寸 联合分配 职能:[eq35]A 子集 [eq36] 被称为 统计模型 (或 模型 规范 或者,简单地说, 模型$ Xi $. 如果 $ F_ {Xi},皮皮$ 这个模型据说是 正确指定 (要么 规范)。否则,如果 [eq37] 这个模型据说是 错误指定.

以下示例是上一个示例的延续 部分。

假设我们的样本是由 n 实现 $ x_ {1} $, ..., $ x_ {n} $n 随机变量 X_1, ..., X_n. 假设 n 随机变量是相互独立的,并且它们具有共同的 分配功能 [eq38] 样本是 n尺寸 向量 [eq39]. $ Psi $ 是随机向量的所有可能分布函数的集合 [eq22]. 回顾定义 边际分布 功能 以及相互独立的特征,我们可以定义 统计模型 $菲$ 如 如下:[eq41]

以上述示例为例,删除以下假设: n 随机变量 X_1, ..., X_n 彼此独立。统计模型 $菲$ 是 现在:[eq42]

接下来的小节将介绍与模型相关的一些术语 规范。

参数模型

一个模型 $菲$ 对于 $ Xi $ 如果属于的联合分布函数称为参数模型 $菲$ 与一套对应 $ 的ta $ 真实向量。

定义$菲$ 成为榜样 $ Xi $. 让 [eq43] 成为一组 p尺寸 实向量。让 [eq44] 是与的子集相关联的对应 $菲$ 每一个 $ theta中的$. 三重 [eq45] 是一个 参数模型 当且仅 如果[eq46]的 组 $ 的ta $ 叫做 参数空间。一个向量 $ theta中的$ 被称为 参数.

因此,在参数模型中, $菲$ 与至少一个参数对应 $ heta $.

什么时候 [eq47] 将每个参数关联一个唯一的联合分布函数(即 [eq48] 是一个函数),参数模型称为参数族。

定义 family">[eq49] 是参数模型。如果 $伽马$ 是来自 $ 的ta $$菲$, 然后将参数模型称为 参数族。在 在这种情况下,与参数关联的联合分布函数 $ heta $ 用表示 [eq50].

当每个分布函数仅与一个参数相关联时, 称参数族是可识别的。

定义 p算术的family">[eq51] 成为一个参数化家庭。如果 $伽马$ 是一对一的(即每个分布函数 F 仅与一个参数相关联),则称参数族 是 可识别的.

统计推断

A 统计推断 是关于未知的陈述 分配功能 [eq19], 根据观察到的样品 $ xi $ 和统计模型 $菲$. 统计推断通常是从一组可能的推断中选择的,并且 采取模型限制的形式。给定原始模型的子集 [eq53], a 模型限制 可以是 包含 限制:[eq54]要么 一个 排除 限制:[eq55]

以下是常见的统计推断类型:

  1. 假设检验,一个限制 [eq56] 是提议的,并且在两个可能的语句之间进行选择:

    1. 拒绝限制;

    2. 不要拒绝该限制。

  2. 估算,一个限制 [eq56] 必须从一组可能的限制中选择。

  3. 贝叶斯推理,观察到的样本 $ xi $ 用于更新限制的主观概率 [eq56] 是真的。

决策理论

基于以下内容进行陈述(统计推断)的选择 观察到的数据通常可以形式化为决策问题,其中:

  1. 进行统计推断被视为 行动;

  2. 每个动作可以有不同的 后果, 取决于 哪个分布函数 [eq19] 是真实的;

  3. a 偏好排序 超过可能的后果需要 引起

  4. 一个 最佳行动方案 需要连贯地采取 带有偏好。

有几种不同的方法可以将这种决策问题形式化。的 分析这些决策问题的统计数据分支称为 统计决策理论.

如何引用

请引用为:

Taboga, Marco (2017). "统计推断", 列克特ures on probability theory 一个d mathematical 统计, Third edition. Kindle Direct Publishing. Online appendix. //www.junruiqiche.com/fundamentals-of-statistics/statistical-inference.

这本书

该网站上提供的大多数学习材料现在都以传统教科书格式提供。