3 多维随机变量及其分布¶
3.1 二维离散型随机变量¶
若二维随机变量 \(( X, Y )\) 的取值有限或可列, 则称 \(( X, Y )\) 为二维离散型随机变量
3.1.1 二维离散型随机变量的联合分布¶
设二维离散型随机变量 \(( X, Y)\) 的可能取值为 \(( x_i , y_j )\) , \(i, j = 1,2 , ...\)与一维离散型随机变量相似, 称
为\((X,Y)\)的的联合概率分布律, 简称联合分布律 (joint distribution law) .
显然二维离散型随机变量的联合分布律满足: \((1) p_{ij}\ge0,i,j=1,2,...;\) \((2)\sum_i\sum_jp_{ij}=1\)
3.1.2 二维离散型随机变量的边际分布¶
设二维离散型随机变量 \(( X, Y )\) 的联合分布律为
那么
显然有\(p_{i\cdot}\ge0\), \(p_{\cdot j}\ge 0\), \(\sum_ip_{i\cdot}=1,\sum_jp_{\cdot j}\),即\(p_{i\cdot},i=1,2,...\)与\(p_{\cdot j},j=1,2,...\)满足概率分布律的性质, 它们分别是随机变量 \(X\) 与 \(Y\)的概率分布律, 称为 \(X\) 和 \(Y\) 的边际分布律 (marginal distribution law) 或边缘分布律.
3.1.3 二维离散型随机变量的条件分布¶
设二维离散型随机变量 \((X,Y)\) 的联合分布律为 \(P\{X=x_i,Y=y_j\}=p_{ij},i,j=1,2,...\)
则当 \(P\{Y=y_j\}\ne 0\) 时
同理当 \(P\{X=x_i\}\ne 0\) 时
称上述公式为给定 \({ Y = y_j }\) (或 \({ X = x_j}\)) 的条件下 \(X\) ( 或\(Y\) ) 的条件分布律
3.2 二维随机变量的分布函数¶
3.2.1 二维随机变量的联合分布函数¶
设二维随机变量 \(( X, Y)\) , 对于任意的实数 \(x, y\) , 称函数
为 \((X,Y)\) 的联合概率分布函数, 简称联合分布函数
\(F ( x, y)\) 具有以下性质:
(1) 当给定 \(x = x_0\) 时, \(F( x_0, y)\) 关于 \(y\) 单调不减; 当给定 \(y = y_0\) 时, \(F(x, y_0)\) 关于 \(x\) 单调不减
(2) \(0 ≤ F(x, y) ≤ 1\) , \(F(x, -\infty)=F(-\infty , y)=F(-\infty, -\infty)=0\), \(F(+\infty, +\infty) = 1\) .
(3) \(F(x, y)=F(x + 0, y) , F(x, y) = F(x, y + 0)\),即 \(F(x,y)\) 关于 \(x\) 右连续, 关于 \(y\) 右连续 (证略).
3.2.2 二维随机变量的边际分布函数¶
记二维随机变量 \(( X, Y)\) 的联合分布函数为 \(F( x, y)\) , \(X, Y\) 的边际分布函数为 \(F_x( x), F_y(y)\) ,则
同理,\(F_Y(y)=F(+\infty,y)\)
3.2.3 条件分布函数¶
设 \(( X, Y)\) 为二维离散型随机变量, 当 \(P\{ X = x_i\} ≠ 0\) 时, 称函数
为给定 \(\{ X = x_i \}\) 的条件下 \(Y\) 的条件概率分布函数, 简称条件分布函数.
3.3 二维连续型随机变量¶
3.3.1 二维连续型随机变量的联合分布¶
设二维随机变量 \(( X, Y )\) 的联合分布函数为 \(F (x, y )\) , 若存在二元非负函数 \(f( x , y)\) , 使对任意的实数 \(x, y\) 有
则称 \(( X, Y)\) 为二维连续型随机变量 (bivariate continuous random variable ) ,称 \(f( x , y)\) 为 \(( X, Y)\) 的联合概率密度函数 (joint probability density function ) ,简称联合密度函数.
\(f( x, y)\) 具有以下性质 (其中 \(F (x, y)\) 为 \((X, Y)\) 的联合分布函数):
(1) \(f(x,y)\ge0\)
(2) \(\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(x,y)dxdy=F(-\infty,+\infty)=1\)
(3) 在 \(f ( x, y)\) 的连续点处有
(4) \((X, Y)\) 落入 \(xOy\) 平面任一区域 \(D\) 的概率为
3.3.2 二维连续型随机变量的边际分布¶
设 \((X, Y)\) 为二维连续型随机变量, \(F ( x, y)\), \(f(x, y)\) 分别为 \(( X, Y )\) 的联合分布函数及联合密度函数, 称单个随机变量 \(X\) (或 \(Y\)) 的密度函数为 \(X\) (或 \(Y\) )的边际概率密度函数 (marginal probability density function) , 简称边际密度函数, 且常分别用 \(f_X( x )\) , \(f_Y (y)\) 表示, 由于
由连续型随机变量的定义知 \(X\) 为连续型随机变量, 且 \(X\) 的边际密度函数为
即边际密度函数为联合密度函数关于另一个变量在 \((-\infty,+\infty)\) 上的积分
3.3.3 二维连续型随机变量的条件分布¶
设 \(( X, Y)\) 为二维连续型随机变量, \(f( x, y)\) 为 \(( X, Y )\) 的联合密度函数,\(f_X(x),f_Y(y)\) 为 \(X,Y\) 的边际密度函数。给定 \(\{X=x\}(f_X(x)\ne0)\) 的条件下 \(Y\) 的条件概率密度函数,简称条件概率密度函数,为
证明过程:
在下文中,一般用 \(f(x, y)\) 表示二维连续型随机变量 \((X, Y)\) 的联合密度函数,用 \(f_X(x), f_Y(y)\) 分别表示 \(X, Y\) 的边际密度函数。
由于
且
即此时有
3.3.4 二元均匀分布和二元正态分布¶
二元均匀分布:二维随机变量 \(( X, Y )\) 在二维有界区域 \(D\) 上取值, 且具有联合密度函数
则称 \((X,Y)\) 服从 \(D\)上的均匀分布
二元正态分布:设二维随机变量 \(( X, Y )\) 具有联合密度函数
其中 \(-\infty<\mu_1<+\infty,-\infty<\mu_2<+\infty,\sigma_1>0,\sigma_2>0,|\rho|<1\),则称 \((X,Y)\) 服从参数为 \((\mu_1,\mu_2;\sigma_1,\sigma_2;\rho)\) 的二元正态分布,记为 \((X,Y)\sim N(\mu_1,\mu_2;\sigma_1,\sigma_2;\rho)\)
3.4 随机变量的独立性¶
对任意两个实数集合 \(D_1 , D_2\) , 若
则称随机变量 \(X, Y\) 相互独立, 简称 \(X, Y\) 独立.
也可以写为当且仅当对任意实数 \(x, y\) , 有
成立, 即 \(F( x, y) = F_X(x) · F_Y(y )\) , \(X, Y\) 相互独立.
- 当 \((X,Y)\) 为二维离散型随机变量,设 \(X, Y\) 的可能取值为\(x_i,y_j , i, j = 1,2, ...\) , \(X\) 与 \(Y\) 相互独立的定义等价于: 对于任意的实数 \(x_i,y_j\) 都有
- 当 \((X,Y)\) 为二维连续型随机变量,\(X\) 与 \(Y\) 相互独立的定义等价于 \(f(x,y)=f_X(x)f_Y(y)\) 在除了面积为0的区域外处处成立
如果要说明独立性不成立,只需要找特例即可。
3.5 多元随机变量函数的分布¶
3.5.1 Z=X+Y 的分布¶
若 \((X, Y)\) 为二维离散型随机变量,设 \(P\{X = x_i, Y = y_j\} = p_{ij}, i, j = 1, 2, \cdots\),又设 \(Z\) 的可能取值为 \(z_1, z_2, \cdots, z_k, \cdots\),则显然有
或
特别地,当 \(X\) 与 \(Y\) 相互独立时,(3.5.1) 与 (3.5.2) 就可写成
或
若 \((X, Y)\) 为二维连续型随机变量,设 \((X, Y)\) 的联合密度函数为 \(f(x, y)\),则 \(Z\) 的分布函数为
如图3.5.1所示,作积分变量变换 \(\begin{cases} u = x, \\ v = x + y, \end{cases}\)可知 \(dx \, dy = du \, dv\),所以
从而
若作的积分变量变换为 \(\begin{cases} u = x + y \\ v = y\end{cases}\),通过同样的计算可得
特别地,当 \(X, Y\) 相互独立时,(3.5.5) 与 (3.5.6) 就可写成
Note
已知 \(f(x,y),Z=X+Y\),求 \(f_Z(z)\) 步骤(\(X,Y \text{ 独立}\))
-
确定由 \(x\) 与 \(z\) 构成的被积函数非零区域
-
在 \(x\) 与 \(z\) 作为坐标系统上,画出非零区域图形
-
根据 \(z\) 分段,在各段上对 \(x\) 求积分
离散变量的独立和分布
-
\(X_1, X_2, \cdots, X_n\) 独立且均服从 $ B(1, p) $,则 \(X_1 + X_2 + \cdots + X_n \sim B(n, p)\)
-
\(X \sim B(n_1, p), Y \sim B(n_2, p)\),两者独立,则 \(X + Y \sim B(n_1 + n_2, p)\)
-
\(X \sim \pi(\lambda_1), Y \sim \pi(\lambda_2)\),两者独立,则 \(X + Y \sim \pi(\lambda_1 + \lambda_2)\)
n 个相互独立的正态变量之和仍为正态变量. 即若\(X_1 , X_2 , ... , X_n\) 相互独立, 且\(X_i\sim N(\mu_i,\sigma_i^2)\),则\(\sum_{i=1}^n\sim N(\sum_{i=1}^n\mu_i,\sum_{i=1}^n\sigma^2_i)\)
3.5.2 M=max{X,Y},N=min{X,Y} 的分布¶
记 \(X, Y\) 的联合分布函数为 \(F(x, y)\),且记 \(F_X(t), F_Y(t)\) 分别为 \(X, Y\) 的边际分布函数。
先来讨论 \(M\) 的分布函数,由 \(M\) 的定义可知
特别地,当 \(X\) 与 \(Y\) 相互独立时,
再讨论 \(N\) 的分布函数
或者
特别地,当 \(X\) 与 \(Y\) 相互独立时,
或
以上结果容易推广到 \(n\) 个变量的情形。特别地,设 \(X_1, X_2, \cdots, X_n\) 为 \(n\) 个相互独立的随机变量,相应的分布函数分别为 \(F_1(x), F_2(x), \cdots, F_n(x)\),记 \(M = \max\{X_1, X_2, \cdots, X_n\}\),\(N = \min\{X_1, X_2, \cdots, X_n\}\),则