在Statlect上搜索概率和统计术语
统计列克特
指数 > 概率基础

协方差

通过 博士

协方差是两个随机变量之间关联的度量。

目录

定义

让我们从协方差的定义开始。

定义 两个之间的协方差 随机变量 XY, 表示为 [eq1], 被定义为 如 [eq2]提供 以上 期望值 存在并且是 定义明确的。

了解定义

为了更好地理解协方差的定义,让我们 分析它的构造方式。

协方差是产品的期望值 [eq3], 哪里 $ overline {X} $$ overline {Y} $ 被定义为 如下:[eq4]$ overline {X} $$ overline {Y} $ 是偏差 XY 从各自的手段。

什么时候 [eq3] 为正,表示:

相反,当 [eq3] 为负,表示:

换句话说,当 [eq3] 是肯定的 XY一致的 (他们与均值的偏差相同 标志);什么时候 [eq3] 是负面的 XY不和谐的 (他们与均值的偏差相反 标志)。

因此,该产品 [eq3] 可以解释为衡量之间的相似性 $ overline {X} $$ overline {Y} $ (其实, 的 产品可衡量相似度)。结果,协方差 [eq10]告诉 我们两个变量(分别来自各自变量)的偏差有多相似 平均)。直观地,我们可以将概念表达为 如下:[eq11]

什么时候 [eq12], XY 不显示以上两种趋势中的任何一种。

等效定义

两个随机变量之间的协方差 变量也可以由 式[eq13]哪一个 等同于以上定义中的公式。

证明

这两个定义的等价为 证明为 如下:[eq14]

从这个公式很容易看出 XY 存在并且仅在期望值内定义明确 [eq15], [eq16][eq17] 存在并且定义明确。

该公式具有很大的实际意义,并且经常用于 这些讲座。它通常被称为 协方差 式.

以下示例显示了如何计算两个之间的协方差 离散随机 变数.

X 成为 $ 2imes 1 $ 随机向量,并通过 X_1X_2. 让 支持X[eq18]和 它的 联合概率 质量函数[eq19]的 支持 X_1[eq20]和 它的 边缘 概率质量函数[eq21]的 的期望值 X_1[eq22]的 支持 X_2[eq23]和 其边际概率质量函数 是[eq24]的 的期望值 X_2[eq25]使用 的 转型 定理,我们可以计算出的期望值 $ X_ {1} X_ {2} $:[eq26]因此, 之间的协方差 X_1X_2[eq27]

更多示例,包括有关如何计算两个之间的协方差的示例 连续随机变量,可以在已解决的练习中找到 此页面的底部。

更多细节

以下小节包含有关协方差的更多详细信息。

随机变量与其自身的协方差

X 是一个随机变量, 然后[eq28]

证明

它来自于 方差:[eq29]

对称

协方差运算符为 对称的:[eq30]

证明

通过 协方差的定义,我们 有[eq31]

两个随机变量之和的方差

X_1X_2 是两个随机变量。那么它们的和的方差是 [eq32]

证明

上式推导为 如下:[eq33]

因此,要计算两个随机变量之和的方差,我们需要 知道他们的协方差。

显然, 式[eq34]持有 只有当 X_1X_2 协方差为零

两个随机变量之和的方差公式可以是 概括为两个以上随机变量的总和(请参见 n个随机变量之和的方差)。

协方差算子的双线性

协方差算子在两个参数中都是线性的。让 X_1, X_2Y 是三个随机变量,让 a_1a_2 是两个常数。然后,第一个参数是 线性:[eq35]

证明

这个 通过使用期望的线性来证明 值:[eq36]

通过 对称,第二个参数是 线性:[eq37]

第一个和第二个参数的线性都被称为 双线性.

通过反复应用以上论点,可以证明双线性 对于两个以上的线性组合也成立 变量:[eq38]

n个随机变量之和的方差

和的方差 n 随机变量 是[eq39]

证明

使用双线性证明了这一点 协方差运算符 以上):[eq40]

这个公式意味着当总和中的所有随机变量都为零时 彼此协方差,那么总和的方差就是 的 差异:[eq41]这个 是正确的,例如,当总和中的随机变量相互 独立的(因为 独立意味着 零协方差)。

解决的练习

您可以在下面找到一些练习,其中包含已说明的解决方案。

练习1

X 成为 $ 2imes 1 $ 离散随机向量 和 用以下方式表示其组成部分 X_1X_2. 让支持 X[eq42]和 它的联合概率质量函数 是[eq43]

计算之间的协方差 X_1X_2.

的支持 X_1[eq44]和 它的 边缘 概率质量函数[eq45]的 的期望值 X_1[eq46]的 支持 X_2[eq47]和 其边际概率质量函数 是[eq48]的 的期望值 X_2[eq49]通过 使用变换定理,我们可以计算出的期望值 $ X_ {1} X_ {2} $:[eq50]因此, 之间的协方差 X_1X_2[eq51]

练习2

X 成为 $ 2imes 1 $ 离散随机向量,并通过 X_1X_2. 让支持 X[eq52]和 它的联合概率质量函数 是[eq53]

计算之间的协方差 X_1X_2.

的支持 X_1[eq54]和 其边际概率质量函数 是[eq55]的 的平均值 X_1[eq56]的 支持 X_2[eq57]和 它的概率质量函数 是[eq58]的 的平均值 X_2[eq59]的 产品的期望值 $ X_ {1} X_ {2} $ 能够 通过使用变换得出 定理:[eq60]因此, 通过将各个部分放在一起,我们得到 X_1X_2[eq61]

练习3

XY 是两个随机变量,例如 那[eq62]

计算以下 协方差:[eq63]

通过协方差的双线性 运营商,我们 有[eq64]

练习4

[eq65] 成为 连续 随机向量 在支持下: [eq66]在 也就是说, $ R_ {XY} $ 是所有夫妇的集合 $ left(x,y
权)$ 这样 [eq67][eq68]. 让联合概率密度函数为 [eq65][eq70]计算 之间的协方差 XY.

的支持 X[eq71]从而, 什么时候 [eq72], 的 边缘 概率密度函数X0, 当......的时候 [eq73], 的边际概率密度函数 X[eq74]因此, 的边际概率密度函数 X[eq75]的 的期望值 X[eq76]的 支持 Y[eq77]什么时候 [eq78], 的边际概率密度函数 Y0, 当......的时候 [eq79], 的边际概率密度函数 Y[eq80]因此, 的边际概率密度函数 Y[eq81]的 的期望值 Y 是:[eq82]的 产品的期望值 $ XY $ 可以通过转换来计算 定理:[eq83]因此, 通过协方差公式, XY[eq84]

练习5

[eq65] 是具有支持的连续随机向量 [eq86]和 它的联合概率密度函数 是[eq87]计算 之间的协方差 XY.

的支持 Y[eq88]什么时候 [eq89], 的边际概率密度函数 Y0, 当......的时候 [eq90], 的边际概率密度函数 Y[eq91]通过 放在一起,我们有边际概率密度 的功能 Y[eq92]的 的期望值 Y[eq93]的 支持 X[eq94]什么时候 [eq95], 的边际概率密度函数 X0, 当......的时候 [eq96], 的边际概率密度函数 X 是:[eq97]我们 没有明确计算积分,但是我们写了边际概率 的密度函数 X 如 如下:[eq98]的 的期望值 X[eq99]的 产品的期望值 $ XY $ 可以通过转换来计算 定理:[eq100]因此, 协方差公式 给[eq101]

练习6

XY 是两个随机变量,例如 那[eq102]

计算以下 协方差:[eq103]

通过协方差的双线性 接线员,我们有 那[eq104]

如何引用

请引用为:

Taboga, Marco (2017). "协方差", 列克特ures on probability 的ory 和 mathematical statistics, Third edition. Kindle Direct Publishing. Online appendix. //www.junruiqiche.com/fundamentals-of-probability/covariance.

这本书

该网站上提供的大多数学习材料现在都以传统教科书格式提供。