本讲座讨论如何执行 测试 假设 关于a的系数 线性回归 模型 用普通最小二乘法(OLS)估算。
讲座分为两个部分:
在第一部分中,我们讨论了正态线性中的假设检验 回归模型,其中系数的OLS估计值具有 正常 分配 以回归矩阵为条件;
在第二部分中,我们展示了如何以线性方式进行假设检验 可以证明OLS估计是渐近的回归模型 正常。
在这两部分中,回归模型
是哪里
是一个输出变量,
是一个
输入向量
是一个
系数向量和
是一个错误术语。有
样本中的观察结果
.
我们还表示:
通过
的
的向量
输出
通过
的
的矩阵
输入
通过
的
误差向量
使用这种表示法,我们可以
写
此外,OLS估计器
是
我们假设设计矩阵
具有全等级,因此矩阵
是可逆的。
在本节中,我们得出有关法线线性系数的测试
回归模型。在此模型中,误差向量
假设有一个 多元正态
分配 有条件的
,
平均等于
和协方差矩阵相等
至
哪里
是个
单位矩阵和
是一个正常数。
可以证明(请参阅有关 正常 线性回归模型)条件正态性的假设 暗示:
在对单个系数进行限制的测试中,我们测试了
空值
假设哪里
是个
-th
系数向量的输入
和
.
换句话说,我们的零假设是
-th
系数等于特定值。
通常用
测试
统计哪里
是个
-th
矩阵的对角线入口
.
测试统计
有一个 标准
学生的t分布 与
自由程度。因此,将其称为t统计量和检验
称为t检验。
如果以下条件成立,则原假设被拒绝
落在接受区域之外。
如何确定接受区域不仅取决于期望的
测试的大小,还要看是否
测试是两尾的(如果我们认为
可能小于或大于
)
或单尾(如果我们假设只有两件事之一,即较小或
更大)。有关如何确定验收的更多详细信息
区域,请参阅 危急
价值观.
在测试一组线性限制时,我们测试空值
假设哪里
是一个
矩阵和
是一个
向量。
是限制的数量。
例
假设
是
并且我们要检验假设
.
我们可以用下面的形式写
通过
设置
例
假设
是
并且我们要测试两个限制是否
和
同时举行。第一个限制可以写成
如
所以
我们
有
该假设通常通过检验来检验
统计哪一个
有一个 F分布
与
和
自由程度。因此,它被称为F统计量和检验
称为F检验。
在null和有条件的情况下
,
向量
,
成为一个
线性的
正常随机向量的变换
,
与分布
意思
和
协方差
矩阵
从而,
我们可以
写
以来
是,二次形式
具有卡方分布
自由度(请参阅
二次的
涉及法向量的形式)。此外,由于
具有带有参数的Gamma分布
和
的
统计
具有
卡方分布
自由度(请参阅
伽玛
分配)。因此,我们可以
写
从而
是两个卡方变量之间的比率,每个变量除以其度数
自由。这两个变量是独立的,因为
仅取决于
和
仅取决于
,
和
和
是独立的。作为结果,
具有F分布
和
自由度(请参阅
F分布)。
F检验通常是单尾的。 F右尾的临界值 选择分布以实现所需的测试大小。然后, 如果F统计量大于F统计量,则拒绝原假设。 临界值。
使用统计数据包进行线性回归时,通常会得到
包含F统计量值的回归输出。通常这是
通过对所有
回归系数等于
(截距上的系数除外)。
正如我们在题为
线性的
回归-最大似然,最大似然估计
正常线性回归模型的系数向量等于OLS
估计量
.
结果,通常
测试
基于最大似然法 (例如。,
沃尔德,
拉格朗日乘数,
可能性
比)可用于进行关于
.
在本节中,我们说明如何执行关于 OLS估计量为时的线性回归模型的系数 渐近正常。
正如我们在题为 OLS估算器 属性,在几种情况下(即在不同的假设条件下) 可以证明:
OLS估算器
渐近是正常的
是的
哪里
表示 收敛
在分配中 (作为样本量
趋于无穷大),并且
是具有均值的多元正态随机向量
和协方差矩阵
;
的价值
矩阵
取决于有关回归模型的一组假设;
有可能得出一个一致的估计量
的
,
那
是的
哪里
表示 收敛
很有可能 (再次为
趋于无穷大)。估计量
是观察到的输入的容易计算的函数
和
输出
.
这两个属性用于推导其的渐近分布。 假设检验中使用的检验统计量。
在z检验中,原假设是对单个条件的限制
系数:哪里
是个
-th
系数向量的输入
和
.
测试统计
是哪里
是个
-th
估计量的对角线入口
渐近协方差矩阵
测试统计
收敛到一个
标准正常
分配 作为样本量
增加。因此,它称为z统计量(因为字母z
通常用于表示标准正态分布),该测试称为
z测试。
什么时候
很大,我们近似于
渐近线(标准正态)。然后,我们使用检验统计量
按照通常的方式:根据所需的测试尺寸和
的分布
,
我们确定临界值和接受区域。空值
假设被拒绝,如果
落在接受区域之外。
在卡方检验中,原假设是一组
线性的
限制条件
哪里
是一个
矩阵和
是一个
向量。
测试统计
是哪一个
收敛到
卡方
分配 与
自由程度。因此,它称为卡方统计量,
该测试称为卡方检验。
我们可以编写测试统计信息
如 通过
关于收敛的假设
和
,
根据连续映射定理,我们有
那
通过
斯卢茨基定理,我们
有
但
与
意思
和
方差
从而,
但,
通过
标准
正规二次形式的结果,右边的二次形式
边具有卡方分布
自由程度
(
是向量的维数
)
设置测试时,实际分配
用渐近线(卡方)近似。
像F检验一样,卡方检验通常也是单尾的。所需 测试的大小是通过在 卡方分布的右尾。如果null被拒绝 卡方统计量大于临界值。
请引用为:
Taboga, Marco (2017). "线性回归-假设检验", 列克特ures on probability 的ory 和 mathematical 统计, Third edition. Kindle Direct Publishing. Online appendix. //www.junruiqiche.com/fundamentals-of-statistics/linear-regression-hypothesis-testing.