在Statlect上搜索概率和统计术语
统计 列克特
指数 > 概率基础

线性相关

通过 博士

线性相关性是两个随机变量之间依赖关系的量度 取值介于-1和1之间。它与协方差和 它的解释与协方差非常相似。

目录

定义

XY 是两个 随机变量 。 的 线性的 相关系数 (或皮尔逊相关系数) 之间 XY, 表示为 [eq1] $ 
 ho _ {XY} $ , 被定义为 如下: [eq2] 哪里 [eq3] 是之间的协方差 XY[eq4][eq5] 标准偏差XY.

线性相关系数只有在 [eq6], [eq7][eq8] 存在并且定义明确。

请注意,原则上,仅当 [eq9][eq5] 严格大于零。但是,通常认为 [eq11] 当两个标准偏差之一为零时。这相当于 假如说 [eq12] 因为 [eq13] 当两个标准偏差之一为零时。

解释

解释类似于协方差的解释: 之间的相关性 XY 提供了一个衡量标准与各自均值偏差的相似程度的度量 是(请参阅标题为“ 协方差 为一个 详细说明)。

线性相关具有被限制在 $-1$1:[eq14]

由于具有此属性,相关性可以轻松理解强度 随机变量之间的线性相关性:更紧密的相关性 是为了 1, 之间的正线性相关性越强  $ X $ Y 是(并且离它越近 $-1$, 之间的负线性相关性越强 XY 是)。

术语

经常使用以下术语:

  1. 如果 [eq15] 然后 XY 据说是 正线性相关 (或简单地说 正相关 )。

  2. 如果 [eq16] 然后 XY 据说是 负线性相关 (或简单地说 负相关 )。

  3. 如果 [eq17] 然后 XY 据说是 线性相关 (或简单地说 相关的 )。

  4. 如果 [eq18] 然后 XY 据说是 不相关的 。另请注意 [eq19] $=0$, 因此有两个随机变量 XY 每当不相关 [eq20].

以下示例显示了如何计算线性系数 两个离散随机变量之间的相关性。

X 成为 $2$ 尺寸 随机向量 并用 X_1X_2. 让支持 X[eq21] 和 它的 联合概率 质量函数[eq22] 支持 X_1[eq23] 和 它的 概率质量 功能 [eq24] 期望值X_1[eq25] 的 的期望值  $ X_ {1} ^ {2} $ [eq26] 方差 X_1[eq27] 的 的标准偏差 X_1 是: [eq28] 的 支持 X_2 是: [eq29] 和 它的概率质量函数 是 [eq30] 的 的期望值 X_2[eq31] 的 的期望值  $ X_ {2} ^ {2} $ [eq32] 的 的方差 X_2[eq33] 的 的标准偏差 X_2[eq34] 使用 的 转型 定理 ,我们可以计算出的期望值  $ X_ {1} X_ {2} $ :[eq35] 因此, 之间的协方差 X_1X_2[eq36] 和 线性相关系数 是: [eq37]

更多细节

以下各节包含有关线性相关的更多详细信息 系数。

随机变量与自身的相关性

X 是一个随机变量, 然后 [eq38]

证明

这证明为 如下: [eq39] 哪里 我们已经利用了事实 那 [eq40]

对称

线性相关系数为 对称的: [eq41]

证明

这证明为 如下: [eq42] 哪里 我们使用了协方差为 对称的: [eq43]

解决的练习

您可以在下面找到一些练习,其中包含已说明的解决方案。

练习1

X 成为  $ 2imes 1 $ 离散随机向量,并通过 X_1X_2. 让支持 X[eq44] 和 它的联合概率质量函数 是 [eq45]

计算之间的线性相关系数 X_1X_2.

的支持 X_1[eq46] 和 它的 边缘 概率质量函数[eq47] 的 的期望值 X_1[eq48] 的 的期望值  $ X_ {1} ^ {2} $ [eq49] 的 的方差 X_1[eq50] 的 的标准偏差 X_1[eq51] 的 支持 X_2[eq52] 和 其边际概率质量函数 是 [eq53] 的 的期望值 X_2[eq54] 的 的期望值  $ X_ {2} ^ {2} $ [eq55] 的 的方差 X_2[eq56] 的 的标准偏差 X_1[eq57] 使用 变换定理,我们可以计算出的期望值  $ X_ {1} X_ {2} $ :[eq58] 因此, 之间的协方差 X_1X_2[eq59] 和 两者之间的线性相关系数 X_1X_2[eq60]

练习2

X 成为  $ 2imes 1 $ 离散随机向量,并通过 X_1X_2. 让支持 X[eq61] 和 它的联合概率质量函数 是 [eq62]

计算之间的线性相关系数 X_1X_2.

的支持 X_1[eq63] 和 其边际概率质量函数 是 [eq64] 的 的平均值 X_1[eq65] 的 的期望值  $ X_ {1} ^ {2} $ [eq66] 的 的方差 X_1[eq67] 的 的标准偏差 X_1[eq68] 的 支持 X_2[eq69] 和 它的概率质量函数 是 [eq70] 的 的平均值 X_2[eq71] 的 的期望值  $ X_ {2} ^ {2} $ [eq72] 的 的方差 X_2[eq73] 的 的标准偏差 X_2[eq74] 的 产品的期望值  $ X_ {1} X_ {2} $ 能够 使用转换得出 定理 [eq75] 因此, 放在一起,之间的协方差 X_1 $ X_ {2} $ [eq76] 和 两者之间的线性相关系数 X_1X_2[eq77]

练习3

[eq78] 成为 连续 随机向量 在支持下 [eq79] 和 让其联合概率密度函数 是 [eq80] 计算 两者之间的线性相关系数 XY.

的支持 Y[eq81] 什么时候 $y
otin R_{Y}$, 的 边缘 概率密度函数Y0, 当......的时候  $ yin R_ {Y} $ , 的边际概率密度函数 Y 可以通过积分获得 x 联合概率密度为 如下: [eq82] 从而, 的边际概率密度函数 Y[eq83] 的 的期望值 Y[eq84] 的 的期望值  $ Y ^ {2} $ [eq85] 的 的方差 Y[eq86] 的 的标准偏差 Y[eq87] 的 支持 X[eq88] 什么时候 $x
otin R_{X}$, 的边际概率密度函数 X0, 当......的时候  $ xin R_ {X} $ , 的边际概率密度函数 X 可以通过积分获得  $ y $ 联合概率密度为 如下: [eq89] 我们 没有明确计算积分,但是我们写了边际概率 的密度函数 X 如 如下: [eq90] 的 的期望值 X[eq91] 的 的期望值  $ X ^ {2} $ [eq92] 的 的方差 X[eq93] 的 的标准偏差 X[eq94] 的 产品的期望值  $ XY $ 可以通过使用转换来计算 定理: [eq95] 因此, 通过协方差公式, XY[eq96] 和 两者之间的线性相关系数 XY[eq97]

如何引用

请引用为:

Taboga, Marco (2017). "线性相关", 列克特 ures on probability 的 ory 和 mathematical statistics, Third edition. Kindle Direct Publishing. Online appendix. //www.junruiqiche.com/fundamentals-of-probability/linear-correlation.

这本书

该网站上提供的大多数学习材料现在都以传统教科书格式提供。