线性相关性是两个随机变量之间依赖关系的量度 取值介于-1和1之间。它与协方差和 它的解释与协方差非常相似。
让
和
是两个 随机变量 。 的 线性的
相关系数 (或皮尔逊相关系数)
之间
和
,
表示为
或
,
被定义为
如下:
哪里
是之间的协方差
和
和
和
是 标准偏差 的
和
.
线性相关系数只有在
,
和
存在并且定义明确。
请注意,原则上,仅当
和
严格大于零。但是,通常认为
当两个标准偏差之一为零时。这相当于
假如说
因为
当两个标准偏差之一为零时。
解释类似于协方差的解释:
之间的相关性
和
提供了一个衡量标准与各自均值偏差的相似程度的度量
是(请参阅标题为“ 协方差 为一个
详细说明)。
线性相关具有被限制在
和
:
由于具有此属性,相关性可以轻松理解强度
随机变量之间的线性相关性:更紧密的相关性
是为了
,
之间的正线性相关性越强
和
是(并且离它越近
,
之间的负线性相关性越强
和
是)。
经常使用以下术语:
如果
然后
和
据说是 正线性相关 (或简单地说
正相关 )。
如果
然后
和
据说是 负线性相关 (或简单地说
负相关 )。
以下示例显示了如何计算线性系数 两个离散随机变量之间的相关性。
例
让
成为
尺寸
随机向量 并用
和
.
让支持
是
和
它的 联合概率
质量函数
是
的
支持 的
是
和
它的 概率质量
功能
是
的
期望值 的
是
的
的期望值
是
的
方差 的
是
的
的标准偏差
是:
的
支持
是:
和
它的概率质量函数
是
的
的期望值
是
的
的期望值
是
的
的方差
是
的
的标准偏差
是
使用
的 转型
定理 ,我们可以计算出的期望值
:
因此,
之间的协方差
和
是
和
线性相关系数
是:
以下各节包含有关线性相关的更多详细信息 系数。
让
是一个随机变量,
然后
这证明为
如下: 哪里
我们已经利用了事实
那
线性相关系数为
对称的:
这证明为
如下: 哪里
我们使用了协方差为
对称的:
您可以在下面找到一些练习,其中包含已说明的解决方案。
让
成为
离散随机向量,并通过
和
.
让支持
是
和
它的联合概率质量函数
是
计算之间的线性相关系数
和
.
的支持
是
和
它的 边缘
概率质量函数
是
的
的期望值
是
的
的期望值
是
的
的方差
是
的
的标准偏差
是
的
支持
是
和
其边际概率质量函数
是
的
的期望值
是
的
的期望值
是
的
的方差
是
的
的标准偏差
是
使用
变换定理,我们可以计算出的期望值
:
因此,
之间的协方差
和
是
和
两者之间的线性相关系数
和
是
让
成为
离散随机向量,并通过
和
.
让支持
是
和
它的联合概率质量函数
是
计算之间的线性相关系数
和
.
的支持
是
和
其边际概率质量函数
是
的
的平均值
是
的
的期望值
是
的
的方差
是
的
的标准偏差
是
的
支持
是
和
它的概率质量函数
是
的
的平均值
是
的
的期望值
是
的
的方差
是
的
的标准偏差
是
的
产品的期望值
能够
使用转换得出
定理
因此,
放在一起,之间的协方差
和
是
和
两者之间的线性相关系数
和
是
让
成为 连续
随机向量 在支持下
和
让其联合概率密度函数
是
计算
两者之间的线性相关系数
和
.
的支持
是
什么时候
,
的 边缘
概率密度函数 的
是
,
当......的时候
,
的边际概率密度函数
可以通过积分获得
联合概率密度为
如下:
从而,
的边际概率密度函数
是
的
的期望值
是
的
的期望值
是
的
的方差
是
的
的标准偏差
是
的
支持
是
什么时候
,
的边际概率密度函数
是
,
当......的时候
,
的边际概率密度函数
可以通过积分获得
联合概率密度为
如下:
我们
没有明确计算积分,但是我们写了边际概率
的密度函数
如
如下:
的
的期望值
是
的
的期望值
是
的
的方差
是
的
的标准偏差
是
的
产品的期望值
可以通过使用转换来计算
定理:
因此,
通过协方差公式,
和
是
和
两者之间的线性相关系数
和
是
请引用为:
Taboga, Marco (2017). "线性相关", 列克特 ures on probability 的 ory 和 mathematical statistics, Third edition. Kindle Direct Publishing. Online appendix. //www.junruiqiche.com/fundamentals-of-probability/linear-correlation.