设计矩阵是 矩阵 包含数据 关于几个人或物体的多重特征。每一行 对应于一个个人,每列对应一个特征。
设计矩阵是回归分析中的基本数学对象,
例如,在
线性回归
楷模 和在
Logit
楷模。通常用大写字母表示
.
我们在这里提供一些设计矩阵的示例。
例
如果我们测量五个人的身高和体重,我们可以收集
在具有五行两列的设计矩阵中进行测量。每一行
对应于十个人中的一个,第一列包含
高度测量,第二个报告高度
重量:哪里
表示
-th
个人和
她的体重。
例
如果我们收集有关四个国家的国内生产总值(GDP)的数据
国家连续三年,则设计矩阵为
矩阵
哪里,
例如,
是第二年第三国的GDP。
考虑线性
回归哪里
是因变量,
是一个
包含
解释变量(回归变量),
是一个
回归系数向量
是错误项,有
观察
(
)。
因此,我们观察
特征,包含在回归向量中
,
对于每个
观察。
可以在设计中收集所有观察结果
矩阵哪里
表示
-th
向量的输入
,
那就是
-th
回归器。
我们可以类似地将因变量和
错误项分为两个
向量:
定义了设计矩阵
和两个向量
和
,
我们可以将回归方程写成矩阵
形成:
这使我们可以使用 矩阵代数 找到
回归系数的估计量
(请参阅 讲座
线性回归 看看如何)。
在大多数统计模型中,要求设计矩阵具有 全职,即 列必须是 线性地 独立 (例如,参见 正常 线性回归模型)。当不满足此要求时,我们说 设计矩阵存在多重共线性(请参见 这个讲座 对于 细节)。
但是,也可以使用回归模型来设计矩阵 排名不足(即不完全排名),例如 岭回归 模型.
观看有关的讲座 线性回归 楷模 更多细节。
上一页条目: 互协方差矩阵
下一页条目: 离散随机变量
请引用为:
Taboga, Marco (2017). "设计矩阵", 列克特ures on probability theory 和 mathematical statistics, Third edition. Kindle Direct Publishing. Online appendix. //www.junruiqiche.com/glossary/design-matrix.