统计推断是使用观察到的数据推断未知的行为 概率分布的性质和特征 观察到的数据已经生成。用于制作的数据集 推论称为样本。
在最简单的情况下,我们观察到
实现
,
...,
的
独立随机变量
,
...,
有共同点 分配
功能
我们使用观察到的实现来推断
.
稍微滥用语言,我们有时会说
"
随机变量的独立实现
"
而不是说“
独立随机变量
,
...,
具有共同的分配功能
”。
例
某种类型的电子设备的寿命是随机变量
,
其分布函数
未知。假设我们独立观察
组件。用以下方式表示这些实现
,
,
...,
.
我们对...的期望值感兴趣
,
这是一个未知的特征
.
我们推断
根据数据进行估算
与样品
意思
在
这个简单的例子观察到的数据
,
,
...,
构成我们的样本
是我们要进行统计推断的数量。
而在最简单的情况下
,
...,
是独立的随机变量,更复杂的情况是可能的。对于
例:
是否有样本的定义来概括所有 以上特殊情况?幸运的是,它非常简单。
定义
A 样品
是随机向量的实现
.
的分布函数
,
表示为
,
是构成推断对象的未知分布函数。
因此,“样本”仅是“实现随机向量”的同义词。的 以下示例显示了此一般定义如何适应特殊情况 上述案例。
例
当我们观察
实现
,
...,
的
独立随机变量
,
...,
具有共同的分配功能
,
样本是
尺寸
向量
,
这是随机向量的实现
.
的联合分布函数
是
例
当我们观察
实现
,
...,
的
随机变量
,
...,
不是独立的而是具有共同的分配功能
,
样本又是
尺寸
向量
,
这是随机向量的实现
.
但是,在这种情况下,联合分配函数
不能再写成的分布函数的乘积
,
...,
.
例
当我们观察
实现
,
...,
的
独立
尺寸
随机向量
,
...,
具有共同的关节分布功能
,
样本是
尺寸
向量
,
这是随机向量的实现
.
的联合分布函数
是
例
当我们观察
实现
,
...,
的
独立
尺寸
随机向量
,
...,
具有不同的联合分配功能
,
...,
,
样本是
尺寸
向量
,
这是随机向量的实现
.
的联合分布函数
是
由样品制成
实现
,
...,
的
随机变量(或随机
向量):
然后
我们说样本有 尺寸
(或 样本量 是
)。
个人实现
被称为 观察 从样本。
在上一节中,我们定义了一个示例
作为随机向量的实现
具有联合分配功能
.
例子
用于推断
统计人员还不完全了解。属性和
特点
观察之前已知的(或假定已知的)
样本被称为模型
.
用数学术语来说,
是一组联合分配函数,
被认为属于。
定义
让样品
实现一个
维随机
向量
具有联合分配功能
.
让
成为所有人的集合
尺寸
联合分配
职能:
A
子集
被称为 统计模型 (或 模型
规范 或者,简单地说, 模型)
.
如果
这个模型据说是 正确指定 (要么
规范)。否则,如果
这个模型据说是 错误指定.
以下示例是上一个示例的延续 部分。
例
假设我们的样本是由
实现
,
...,
的
随机变量
,
...,
.
假设
随机变量是相互独立的,并且它们具有共同的
分配功能
样本是
尺寸
向量
.
是随机向量的所有可能分布函数的集合
.
回顾定义
边际分布
功能 以及相互独立的特征,我们可以定义
统计模型
如
如下:
例
以上述示例为例,删除以下假设:
随机变量
,
...,
彼此独立。统计模型
是
现在:
接下来的小节将介绍与模型相关的一些术语 规范。
一个模型
对于
如果属于的联合分布函数称为参数模型
与一套对应
真实向量。
定义
让
成为榜样
.
让
成为一组
尺寸
实向量。让
是与的子集相关联的对应
每一个
.
三重
是一个 参数模型 当且仅
如果
的
组
叫做 参数空间。一个向量
被称为 参数.
因此,在参数模型中,
与至少一个参数对应
.
什么时候
将每个参数关联一个唯一的联合分布函数(即
是一个函数),参数模型称为参数族。
定义
family">让
是参数模型。如果
是来自
至
,
然后将参数模型称为 参数族。在
在这种情况下,与参数关联的联合分布函数
用表示
.
当每个分布函数仅与一个参数相关联时, 称参数族是可识别的。
定义
p算术的family">让
成为一个参数化家庭。如果
是一对一的(即每个分布函数
仅与一个参数相关联),则称参数族
是 可识别的.
A 统计推断 是关于未知的陈述
分配功能
,
根据观察到的样品
和统计模型
.
统计推断通常是从一组可能的推断中选择的,并且
采取模型限制的形式。给定原始模型的子集
,
a 模型限制 可以是 包含
限制:
要么
一个 排除
限制:
以下是常见的统计推断类型:
在 假设检验,一个限制
是提议的,并且在两个可能的语句之间进行选择:
拒绝限制;
不要拒绝该限制。
在 估算,一个限制
必须从一组可能的限制中选择。
在 贝叶斯推理,观察到的样本
用于更新限制的主观概率
是真的。
基于以下内容进行陈述(统计推断)的选择 观察到的数据通常可以形式化为决策问题,其中:
进行统计推断被视为 行动;
每个动作可以有不同的 后果, 取决于
哪个分布函数
是真实的;
a 偏好排序 超过可能的后果需要 引起
一个 最佳行动方案 需要连贯地采取 带有偏好。
有几种不同的方法可以将这种决策问题形式化。的 分析这些决策问题的统计数据分支称为 统计决策理论.
请引用为:
Taboga, Marco (2017). "统计推断", 列克特ures on probability theory 一个d mathematical 统计, Third edition. Kindle Direct Publishing. Online appendix. //www.junruiqiche.com/fundamentals-of-statistics/statistical-inference.