本讲座介绍条件概率真人在线斗地主,一类统计 样本数据分为输入和输出数据,以及 通过对条件数据建模来研究两种数据之间的关系 给定输入的输出概率分布。与此相反 到无条件真人在线斗地主(有时也称为生成真人在线斗地主) 通过对输入和输出的联合分布进行建模来研究数据。
在介绍条件真人在线斗地主之前,让我们回顾一下条件真人在线斗地主的主要元素 统计真人在线斗地主(请参阅讲座 统计推断):
有一个样本
,
可以看作是随机向量的实现
(例如,
可能是一个向量,收集了一些独立随机变量的实现
变量);
的
联合
分配功能 的样本,用
,
不清楚;
例子
用于推断
;
一个真人在线斗地主
用于进行推论,其中真人在线斗地主只是一组关节
分配功能
被认为属于。
在条件真人在线斗地主中,样本
分为输入
输出:
哪里
表示输出的向量,并且
输入向量。感兴趣的对象是条件分布
给定的输出功能
输入
和
指定条件真人在线斗地主意味着指定一组条件
分配功能
被认为属于。
换句话说,在条件真人在线斗地主中,真人在线斗地主规范的问题是
通过缩小统计学家的注意力集中于
输出的条件分布,而忽略了
输入。例如,在两个输入
输出是连续随机变量。在这种情况下,请指定
无条件真人在线斗地主等效于指定一个
联合
概率密度函数
对于
输入和输出。但是关节密度可以看作是
边际的和有条件的
密度:
所以,
在无条件真人在线斗地主中,我们显式或隐式地指定了
边际概率密度函数
和
有条件的
概率密度函数
.
另一方面,在条件真人在线斗地主中,我们仅指定条件
我们离开边缘
未指定。
本节介绍在交易时经常使用的一些术语 有条件的真人在线斗地主。
通常会做出以下区分,特别是在机器领域 学习:
如果输出是连续随机变量,则条件真人在线斗地主为 叫做 回归真人在线斗地主;
如果输出是离散随机变量,则取有限多个值 (通常很少),那么条件真人在线斗地主称为 分类 真人在线斗地主.
输入变量通常称为:
预测变量
自变量
特征
解释变量
回归器 (在回归真人在线斗地主的背景下)
输出变量通常称为:
预测
因变量
目标变量
响应变量
回归 (在回归真人在线斗地主的背景下)
以下小节介绍了条件真人在线斗地主的一些示例。
线性回归真人在线斗地主可能是最古老,最易理解和最
广泛使用的条件真人在线斗地主。在线性回归真人在线斗地主中,响应
变数
假定是输入的线性函数
:
哪里
是样本中的任何观察结果
是标量输出,
是一个
输入向量
是一个
常数向量(称为回归系数)和
是不可观察的随机变量,会增加线性关系的噪声
在输入和输出之间。
通过对误差进行假设来指定线性回归真人在线斗地主
术语
.
例如,
通常被认为具有 正态分布 与
零均值并且独立于
.
在这种情况下,我们以输入为条件
,
输出
具有均值的正态分布
.
结果,条件密度为
是
哪里
是的方差
.
的 参数
和
通常是未知的,需要估计。所以,我们有一个不同的
每个值的条件分布
和
在观察样本之前,统计学家认为这是合理的。的
所有这些条件分布的集合(与不同的
参数)构成条件真人在线斗地主
.
要了解有关线性回归的更多信息,请阅读:
入门讲座 线性回归 楷模;
关于的讲座 线性的 正常误差的回归真人在线斗地主.
在逻辑分类真人在线斗地主中,响应变量
是一个 伯努利随机变量:它
只能采用两个值
要么
.
假设
有条件的
概率质量函数 的
是输入的非线性函数
:
哪里
是一个
输入向量
是一个
常数向量和
是定义的逻辑函数
通过
要了解更多信息,您可以阅读有关 后勤 真人在线斗地主.
请引用为:
Taboga, Marco (2017). "条件真人在线斗地主", 列克特ures on probability 的ory 和 mathematical 统计, Third edition. Kindle Direct Publishing. Online appendix. //www.junruiqiche.com/fundamentals-of-statistics/conditional-models.