在Statlect上搜索概率和统计术语
统计列克特
指数 > 词汇表

设计矩阵

通过 博士

设计矩阵是 矩阵 包含数据 关于几个人或物体的多重特征。每一行 对应于一个个人,每列对应一个特征。

设计矩阵是回归分析中的基本数学对象, 例如,在 线性回归 楷模 和在 Logit 楷模。通常用大写字母表示 X.

目录

例子

我们在这里提供一些设计矩阵的示例。

如果我们测量五个人的身高和体重,我们可以收集 在具有五行两列的设计矩阵中进行测量。每一行 对应于十个人中的一个,第一列包含 高度测量,第二个报告高度 重量:[eq1]哪里 $ h_ {i} $ 表示 i-th 个人和 $ w_ {i} $ 她的体重。

如果我们收集有关四个国家的国内生产总值(GDP)的数据 国家连续三年,则设计矩阵为 4美元3美元 矩阵[eq2]哪里, 例如, $ X_ {32} $ 是第二年第三国的GDP。

如何在线性回归中定义设计矩阵

考虑线性 回归[eq3]哪里 $ y_ {i} $ 是因变量, $ x_ {i} $ 是一个 $ 1imes K $ 包含 K 解释变量(回归变量), $ eta $ 是一个 Kx1 回归系数向量 $ arepsilon _ {i} $ 是错误项,有 $ N $ 观察 ($ i = 1,\ ldots,N $)。

因此,我们观察 K 特征,包含在回归向量中 $ x_ {i} $, 对于每个 $ N $ 观察。

可以在设计中收集所有观察结果 矩阵[eq4]哪里 $ x_ {ij} $ 表示 $ j $-th 向量的输入 $ x_ {i} $, 那就是 $ j $-th 回归器。

我们可以类似地将因变量和 错误项分为两个 Kx1 向量:[eq5]

定义了设计矩阵 X 和两个向量 $ y $ε, 我们可以将回归方程写成矩阵 形成:[eq6]

这使我们可以使用 矩阵代数 找到 回归系数的估计量 $ eta $ (请参阅 讲座 线性回归 看看如何)。

设计矩阵的等级

在大多数统计模型中,要求设计矩阵具有 全职,即 列必须是 线性地 独立 (例如,参见 正常 线性回归模型)。当不满足此要求时,我们说 设计矩阵存在多重共线性(请参见 这个讲座 对于 细节)。

但是,也可以使用回归模型来设计矩阵 排名不足(即不完全排名),例如 岭回归 模型.

更多细节

观看有关的讲座 线性回归 楷模 更多细节。

继续阅读词汇表

上一页条目: 互协方差矩阵

下一页条目: 离散随机变量

如何引用

请引用为:

Taboga, Marco (2017). "设计矩阵", 列克特ures on probability theory 和 mathematical statistics, Third edition. Kindle Direct Publishing. Online appendix. //www.junruiqiche.com/glossary/design-matrix.

这本书

该网站上提供的大多数学习材料现在都以传统教科书格式提供。