在Statlect上搜索概率和统计术语
统计列克特
指数 > 的基本原理 可能性

随机变量

通过 博士

随机变量是其值取决于变量a的结果的变量 概率实验。它的值是先验未知的,但是它变得已知 一旦实验结果实现。

目录

定义

表示为 欧米茄 样本空间 (全部 实验的可能结果)。随机变量将实数关联 每个元素的编号 欧米茄, 如以下定义所述。

定义 A 随机变量 X 是样本空间中的函数 欧米茄 到实数集 R:[eq1]

在严格的(测度论)概率论中,函数 X 也必须是可测量的(请参见 更严格 随机变量的定义)。

实数 [eq2] 关联到 采样点 欧米茄中的欧米茄 被称为 实现 随机变量的一套 所有可能的实现都称为 支持 并由表示 R_X.

符号

关于符号的一些说明是按顺序进行的:

  1. 的依赖 X欧米茄 通常被省略,也就是说,我们只写 X 代替 [eq3].

  2. 如果 [eq4], 符号的确切含义 [eq5] 是个 以下:[eq6]

  3. 如果 [eq4], 我们有时会使用符号 [eq8] 与以下 含义:[eq9]在 这个案例, $ QTR {rm} {P} _ {X} $ 被解释为实数集上的概率测度, 由随机变量引起 X. 通常,统计学家会在概率模型中建立一个随机变量 X 通过直接指定来定义 $ QTR {rm} {P} _ {X} $, 没有指定样本空间 欧米茄.

以下示例说明了随机变量的实现方式 与概率实验的结果有关。

假设我们掷硬币。可能的结果要么是尾巴 ($ T $) 或头 (H), 那 是的[eq10]的 两个结果分配相等 概率:[eq11]如果 尾巴 ($ T $) 是结果,如果赢了,我们赢一美元 (H) 是我们损失一美元的结果。数量 X 我们赢(或输)是一个随机变量,定义为 如下:[eq12]的 赢得一美元的可能性 是[eq13]的 损失一美元的可能性 是[eq14]的 损失两美元的可能性 是[eq15]

离散随机变量

大多数时候,统计学家会处理两种特殊的随机 变量:

  1. 离散随机变量;

  2. 连续随机变量。

本节定义第一种,下一部分介绍 第二种。

定义 随机变量 X离散的 如果

  1. 它的支持 R_X 是一个 可数集;

  2. 有一个功能 [eq16], 叫做 概率质量函数 (或pmf或概率 功能) X, 这样,对于任何 $ xin U {211d} $:[eq17]

以下是离散随机变量的示例。

A 伯努利随机变量 是一个 离散随机变量的示例。它只能采用两个值: 1 很有可能 $ q $0 很有可能 $1-q$, 哪里 [eq18]. 它的支持是 [eq19]. 其概率质量函数 是[eq20]

概率质量函数的性质在下面更详细地讨论 演讲题目 正当概率质量 职能。我们在这里预期概率质量函数为 具有两个基本特性。

  1. 非负性: [eq21] 对于任何 $ xin U {211d} $;

  2. 支持总和等于 1: [eq22].

事实证明,不仅任何概率质量函数都必须满足这些条件 两个属性,但是满足这两个属性的任何函数是 合法的概率质量函数。您可以找到有关的详细讨论 这个事实在前面的讲座中。

连续随机变量

连续变量定义如下。

定义 随机变量 X 连续 (要么 绝对 连续的),当且仅当

  1. 它的支持 R_X 不可数;

  2. 有一个功能 [eq23], 叫做 概率密度函数 (或pdf或密度 功能) X, 这样,在任何间隔内 [eq24]:[eq25]

现在我们用一个例子来说明定义。

A 统一随机变量 (间隔 $ left [0,1
权] $) 是连续变量的一个例子。在间隔内可以取任何值 $ left [0,1
权] $. 相等长度的所有子间隔均可能。它的支持是 [eq26]. 其概率密度函数 是[eq27]的 实现的概率 X 例如属于 [eq28][eq29]

对概率密度函数的性质进行了更详细的讨论 在题为 合法概率密度 职能。我们在这里预计概率密度函数为 具有两个基本属性:

  1. 非负性: [eq30] 对于任何 $ xin U {211d} $;

  2. 积分超过 R 等于 1: [eq31].

事实证明,不仅任何概率密度函数都必须满足这些要求 两个属性,但是满足这两个属性的任何函数是 合法的概率密度函数。您可以找到详细的讨论 在前面的讲座中对此事实进行了介绍。

一般随机变量

随机变量,既不是离散变量也不是连续变量,是 通常根据其分配功能来表征。

定义 X 是一个随机变量。的 分配功能 (要么 的累积分布函数或cdf) X 是一个功能 [eq32] 这样 那[eq33]

如果我们知道随机变量的分布函数 X, 然后我们可以轻松地计算出 X 属于区间 [eq34][eq35]

证明

注意 那[eq36]哪里 右侧的两组不相交。因此, 可加性:[eq37]通过 重新整理条款,我们 得到[eq35]

更多细节

在以下小节中,您可以找到有关随机变量和 单变量概率分布。

分布的导数 连续变量的功能

请注意,如果 X 是连续的 然后[eq39]

因此,通过对 x 上面等式的两边,我们 获得[eq40]

连续随机变量 和零概率事件

请注意,如果 X 是一个连续的随机变量, X 具有任何特定值 $ xin R_ {X} $ 等于 零:[eq41]

因此,事件 [eq42] 对任何人来说都是零概率事件 $ xin R_ {X} $.

演讲题为 零概率事件 包含对这个看似矛盾的事实的详尽讨论: 可能会发生 [eq43], 事件 [eq44] 发生的可能性为零。

更严格的定义 random variable

随机变量可以通过使用 量度理论的术语,尤其是 sigma代数,可测集和概率空间在末尾引入 讲座 可能性.

定义[eq45] 成为 概率空间,在哪里 欧米茄 是一个样本空间 [eq46] 是事件的西格玛代数( 欧米茄) 和 $ QTR {rm} {P} $ 是在 [eq47]. 让 [eq48] 是实数集的Borel sigma-代数 R (即包含所有开放子集的最小sigma-代数 R)。 功能 [eq49] 这样 [eq50]对于 任何 [eq51] 据说是一个随机变量 欧米茄.

这个定义定义确保了实现的可能性 随机变量的 X 将属于一个集合 [eq51] 可以定义为 [eq53]哪里 右边的概率得到了很好的定义,因为 [eq54] 是可以测量的。

有一个问题有待回答:为什么我们引入异国情调的概念 Borel sigma代数?显然,如果我们想将概率分配给子集 的 R (随机变量的实现 X 可能属于),那么我们需要定义的子集的sigma-algebra R (请记住,我们需要一个sigma-algebra来定义概率 严格地)。但是为什么我们不能考虑更简单易懂的所有集合 的可能子集 R, 哪个是西格玛代数?简短的答案是,我们无法定义 较大的sigma-代数上的概率测度(即包含更多子集 R) 比Borel sigma-algebra:每次尝试这样做时,我们最终都会发现一些 概率的sigma-additability属性所针对的不可数集 不成立(即,它们的概率不同于 的概率)或不等于 一减去补码的概率。

解决的练习

您可以在下面找到一些练习,其中包含已说明的解决方案。

练习1

X 是离散的随机变量。让它支持 R_X[eq55]

让其概率质量函数 [eq56][eq57]

计算以下 可能性:[eq58]

通过概率的加和,我们有 那[eq59]

练习2

X 是离散的随机变量。让它支持 R_X 成为第一个 $20$ 自然 数字:[eq60]

让其概率质量函数 [eq56][eq62]

计算 可能性[eq63]

通过概率的可加性, 我们 获得[eq64]

练习3

X 是离散的随机变量。让它支持 R_X[eq65]

让其概率质量函数 [eq56][eq67]哪里 [eq68] 是个 二项式系数.

计算 可能性[eq69]

首先请注意, 可加性:[eq70]

因此,为了计算 [eq71], 我们需要评估这三个点的概率质量函数 $x=0,$, $x=1$$x=2$:[eq72]

最后,[eq73]

练习4

X 是连续随机变量。让它支持 R_X[eq74]

让其概率密度函数 [eq75][eq76]

计算[eq77]

连续的概率 变量在给定间隔中取一个值,该值等于 概率密度函数 间隔:[eq78]

练习5

X 是一个连续变量。让它支持 R_X[eq79]

让其概率密度函数 [eq75][eq81]

计算[eq82]

与上一练习一样, 的可能性 X 在给定间隔中取一个值等于其密度的整数 在那之上起作用 间隔:[eq83]

练习6

X 是一个连续变量。让它支持 R_X[eq84]

让其概率密度函数 [eq75][eq86]哪里 $ lambda>0$.

计算[eq87]

与上一练习一样,我们需要 计算一个 积分:[eq88]

如何引用

请引用为:

Taboga, Marco (2017). "随机变量", 列克特ures 上 可能性 的ory 和 mathematical statistics, Third edition. Kindle Direct Publishing. Online appendix. //www.junruiqiche.com/fundamentals-of-probability/random-variables.

这本书

该网站上提供的大多数学习材料现在都以传统教科书格式提供。