分数测试(也称为拉格朗日乘数(LM)测试)是 假设检验 用于检查是否 对模型估计的限制 最大似然 (ML)被违反 数据。
为了更好地理解此处介绍的材料,您应该 熟悉ML框架中的假设检验的主要概念(请参阅 介绍性演讲题为 最大 可能性-假设检验)。
分数测试可以应对
零假设 以下的
类:哪里
是属于参数空间的未知参数
,
和
是向量值函数
(
)。
正如我们在上述介绍性演讲中所解释的那样,大多数
可以写入可能要测试的通用参数限制
表格
.
分数测试中使用的统计数据基于ML估算值
从约束优化的解决方案中获得
问题
哪里
是观测数据的样本,
是似然函数,并且
是
满足正在测试的限制的参数集。
测试统计量,称为得分统计量,
是哪里
是个 样本量,
是估计量的渐近协方差矩阵的一致估计量
(请参阅标题为“
最大
似然-协方差矩阵估计),以及
是
对数似然函数的梯度(称为得分),即
对数似然函数的偏导数的向量
参数向量的条目
.
为了导出统计量的渐近性质
,
将维持以下假设:
样本和似然函数满足以下一组条件:
足以保证一致性和渐近正态性
(请参阅有关 最大似然
估算 对于一组这样的条件);
每个
,
的条目
相对于
;
的
项的偏导数的矩阵
关于...的条目
,
称为
并由
,
有等级
.
鉴于以上假设,在零假设下,
,
统计
分布收敛到卡方分布。
表示为
无约束的最大似然
估计:
通过
中值定理,我们有
那
哪里
是一个中间点(其成分严格组成的向量
在组件之间
和那些
)。
以来
,
我们有
那
因此,
再次
根据中值定理,我们有
那
哪里
是Hessian矩阵(二阶偏导数的矩阵),并且
是一个中间点(实际上,确切地说,
黑森州的每一行的中间点)。因为梯度为零
在不受限制的最大值下,我们有
那
和,
作为一个
后果,
和
它
下降
那
现在,
哪里
是一个
向量的拉格朗日乘数。因此,我们有
那
解决
对于
,
我们
获得
现在,可以写出分数统计
如 堵塞
在先前导出的表达式中
,
统计
变成
哪里
给定
在原假设下
和
收敛概率 至
,
也
和
收敛到
,
因为的条目
和
严格包含在
和
.
此外,
哪里
是的渐近协方差矩阵
.
我们以前假设
收敛到
.
因此,通过
连续映射
定理,我们有以下
结果
通过
将到目前为止得出的所有信息放在一起,我们可以写出分数
统计为二次形式的序列
哪里
和
但
在关于 沃尔德测试,我们已经证明
这样的序列在分布上收敛到卡方随机变量
自由度等于
.
在分数检验中,如果分数统计量为零,则原假设被拒绝
超过预定 危急
值
,
那是,
如果
的 测试的大小 可
由其渐近近似
值
哪里
是个 分配
功能 卡方随机变量的
自由程度。
我们可以选择
以便达到预定大小
如下:
下面是一个如何使用分数测试的简单示例。
例
令参数空间为所有的集合
尺寸
向量,即
.
表示true参数的第一部分和第二部分
通过
和
.
假设我们要测试
限制
在
这种情况下,功能
是一个功能
定义的
通过
我们
有那个
和
是
谁的
等级等于
.
另请注意,它不依赖于
.
然后,我们将对数的对数似然函数最大化
(保持
固定在
)。
假设我们获得以下参数和
渐近协方差
矩阵:
哪里
是样本量。还假设分数的值
是
然后,
得分统计为
的
统计量的卡方分布为
自由程度。假设我们希望测试的大小为
.
然后,临界值
是
哪里
是卡方随机变量的累积分布函数,其中
自由度和
可以使用任何统计软件进行计算(我们已经在MATLAB中完成了,
using 的 command
chi2inv(0.99,1)
)。 Thus, 的 test
统计超出关键
值和
我们拒绝原假设。
请引用为:
Taboga, Marco (2017). "分数测试", 列克特ures on probability 的ory 和 mathematical 统计, Third edition. Kindle Direct Publishing. Online appendix. //www.junruiqiche.com/fundamentals-of-statistics/score-test.