跳转至

3 多维随机变量及其分布

文本统计:约 845 个字

3.1 二维离散型随机变量

若二维随机变量 \(( X, Y )\) 的取值有限或可列, 则称 \(( X, Y )\)二维离散型随机变量

3.1.1 二维离散型随机变量的联合分布

设二维离散型随机变量 \(( X, Y)\) 的可能取值为 \(( x_i , y_j )\) , \(i, j = 1,2 , ...\)与一维离散型随机变量相似, 称

\[ P\{X=x_i,Y=y_j\}=p_{ij},i,j=1,2... \]

\((X,Y)\)的的联合概率分布律, 简称联合分布律 (joint distribution law) .

显然二维离散型随机变量的联合分布律满足: \((1) p_{ij}\ge0,i,j=1,2,...;\) \((2)\sum_i\sum_jp_{ij}=1\)

3.1.2 二维离散型随机变量的边际分布

设二维离散型随机变量 \(( X, Y )\) 的联合分布律为

\[ P\{X=x_i,Y=y_j\}=p_{ij},i,j=1,2... \]

那么

\[ P\{X=x_i\}=\sum_{j=1}^{+\infty}p_{ij}=p_{i\cdot} \]
\[ P\{Y=y_j\}=\sum_{i=1}^{+\infty}p_{ij}=p_{\cdot j} \]

显然有\(p_{i\cdot}\ge0\), \(p_{\cdot j}\ge 0\), \(\sum_ip_{i\cdot}=1,\sum_jp_{\cdot j}\),即\(p_{i\cdot},i=1,2,...\)\(p_{\cdot j},j=1,2,...\)满足概率分布律的性质, 它们分别是随机变量 \(X\)\(Y\)的概率分布律, 称为 \(X\)\(Y\) 的边际分布律 (marginal distribution law) 或边缘分布律.

3.1.3 二维离散型随机变量的条件分布

设二维离散型随机变量 \((X,Y)\) 的联合分布律为 \(P\{X=x_i,Y=y_j\}=p_{ij},i,j=1,2,...\)

则当 \(P\{Y=y_j\}\ne 0\)

\[ P\{X=x_i|y=y_j\}=\frac{P\{X=x_i,Y=y_j\}}{P\{Y=y_j\}}=\frac{p_{ij}}{p_{\cdot j}},i=1,2,... \]

同理当 \(P\{X=x_i\}\ne 0\)

\[ P\{y=y_j|X=x_i\}=\frac{P\{X=x_i,Y=y_j\}}{P\{X=x_i\}}=\frac{p_{ij}}{p_{i\cdot }},j=1,2,... \]

称上述公式为给定 \({ Y = y_j }\) (或 \({ X = x_j}\)) 的条件下 \(X\) ( 或\(Y\) ) 的条件分布律

3.2 二维随机变量的分布函数

3.2.1 二维随机变量的联合分布函数

设二维随机变量 \(( X, Y)\) , 对于任意的实数 \(x, y\) , 称函数

\[ F(x,y)=P\{X\le x,Y\le y\} \]

\((X,Y)\) 的联合概率分布函数, 简称联合分布函数

\(F ( x, y)\) 具有以下性质:

(1) 当给定 \(x = x_0\) 时, \(F( x_0, y)\) 关于 \(y\) 单调不减; 当给定 \(y = y_0\) 时, \(F(x, y_0)\) 关于 \(x\) 单调不减

(2) \(0 ≤ F(x, y) ≤ 1\) , \(F(x, -\infty)=F(-\infty , y)=F(-\infty, -\infty)=0\), \(F(+\infty, +\infty) = 1\) .

(3) \(F(x, y)=F(x + 0, y) , F(x, y) = F(x, y + 0)\),即 \(F(x,y)\) 关于 \(x\) 右连续, 关于 \(y\) 右连续 (证略).

3.2.2 二维随机变量的边际分布函数

记二维随机变量 \(( X, Y)\) 的联合分布函数为 \(F( x, y)\) , \(X, Y\)边际分布函数\(F_x( x), F_y(y)\) ,则

\[ F_X(x)=P\{X\le x\}=P\{X\le x,Y<+\infty\}=F(x,+\infty) \]

同理,\(F_Y(y)=F(+\infty,y)\)

3.2.3 条件分布函数

\(( X, Y)\) 为二维离散型随机变量, 当 \(P\{ X = x_i\} ≠ 0\) 时, 称函数

\[ F_{Y|X}(y|x_i)=P\{Y\le y|X=x_i\} \]

为给定 \(\{ X = x_i \}\) 的条件下 \(Y\) 的条件概率分布函数, 简称条件分布函数.

3.3 二维连续型随机变量

3.3.1 二维连续型随机变量的联合分布

设二维随机变量 \(( X, Y )\) 的联合分布函数为 \(F (x, y )\) , 若存在二元非负函数 \(f( x , y)\) , 使对任意的实数 \(x, y\)

\[ F(x,y)=\int_{-\infty}^{x}\int_{-\infty}^y f(u,v)dudv \]

则称 \(( X, Y)\)二维连续型随机变量 (bivariate continuous random variable ) ,称 \(f( x , y)\)\(( X, Y)\)联合概率密度函数 (joint probability density function ) ,简称联合密度函数.

\(f( x, y)\) 具有以下性质 (其中 \(F (x, y)\)\((X, Y)\) 的联合分布函数):

(1) \(f(x,y)\ge0\)

(2) \(\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(x,y)dxdy=F(-\infty,+\infty)=1\)

(3) 在 \(f ( x, y)\) 的连续点处有

\[ \frac{\partial^2F(x,y)}{\partial x\partial y}=f(x,y) \]

(4) \((X, Y)\) 落入 \(xOy\) 平面任一区域 \(D\) 的概率为

\[ P\{(X,Y)\in D\}=\iint_Df(x,y)dxdy \]

3.3.2 二维连续型随机变量的边际分布

\((X, Y)\) 为二维连续型随机变量, \(F ( x, y)\), \(f(x, y)\) 分别为 \(( X, Y )\) 的联合分布函数及联合密度函数, 称单个随机变量 \(X\) (或 \(Y\)) 的密度函数为 \(X\) (或 \(Y\) )的边际概率密度函数 (marginal probability density function) , 简称边际密度函数, 且常分别用 \(f_X( x )\) , \(f_Y (y)\) 表示, 由于

\[ F_X(x)=P\{X\le x\}=P\{X\le x,Y\in (-\infty,+\infty)\}=\int_{-\infty}^x[\int_{-\infty}^{+\infty}f(x,y)dy]dx \]

由连续型随机变量的定义知 \(X\) 为连续型随机变量, 且 \(X\) 的边际密度函数为

\[ f_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy \]

即边际密度函数为联合密度函数关于另一个变量在 \((-\infty,+\infty)\) 上的积分

3.3.3 二维连续型随机变量的条件分布

\(( X, Y)\) 为二维连续型随机变量, \(f( x, y)\)\(( X, Y )\) 的联合密度函数,\(f_X(x),f_Y(y)\)\(X,Y\) 的边际密度函数。给定 \(\{X=x\}(f_X(x)\ne0)\) 的条件下 \(Y\)条件概率密度函数,简称条件概率密度函数,为

\[ f_{Y|X}(y|x)=\frac{f(x,y)}{f_X(x)},-\infty<y<+\infty \]

证明过程:

在下文中,一般用 \(f(x, y)\) 表示二维连续型随机变量 \((X, Y)\) 的联合密度函数,用 \(f_X(x), f_Y(y)\) 分别表示 \(X, Y\) 的边际密度函数。

\((X, Y)\) 为二维连续型随机变量

\[ \begin{aligned} F_{Y|X}(y|x) &= \lim_{\delta \to 0^+} P\{Y \leq y | x < X \leq x + \delta\} \\ &= \lim_{\delta \to 0^+} \frac{P\{x < X \leq x + \delta, Y \leq y\}}{P\{x < X \leq x + \delta\}}\\ &= \lim_{\delta \to 0^+} \frac{F(x + \delta, y) - F(x, y)}{F_X(x + \delta) - F_X(x)}\\ &= \lim_{\delta \to 0^+} \frac{(F(x + \delta, y) - F(x, y)) / \delta}{(F_X(x + \delta) - F_X(x)) / \delta}\\ \end{aligned} \]

由于

\[ \lim_{\delta \to 0^+} \frac{F_X(x + \delta) - F_X(x)}{\delta} = f_X(x) \]

\[ \begin{aligned} \lim_{\delta \to 0^+} \frac{F(x + \delta, y) - F(x, y)}{\delta} &= \frac{\partial}{\partial x} F(x, y) = \frac{\partial}{\partial x} \int_{-\infty}^x \left[ \int_{-\infty}^y f(u, v) \, dv \right] \, du \\ &= \int_{-\infty}^y f(x, v) \, dv, \end{aligned} \]

即此时有

\[ F_{Y|X}(y|x) = \int_{-\infty}^y \frac{f(x, v)}{f_X(x)}dv \]

3.3.4 二元均匀分布和二元正态分布

二元均匀分布:二维随机变量 \(( X, Y )\) 在二维有界区域 \(D\) 上取值, 且具有联合密度函数

\[ f(x,y)=\left\{ \begin{aligned} &\frac{1}{D的面积},\ &&(x,y) \in D,\\ &0, &&其他, \end{aligned}\right. \]

则称 \((X,Y)\) 服从 \(D\)上的均匀分布

二元正态分布:设二维随机变量 \(( X, Y )\) 具有联合密度函数

\[ f(x,y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}exp\{-\frac{1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]\} \]

其中 \(-\infty<\mu_1<+\infty,-\infty<\mu_2<+\infty,\sigma_1>0,\sigma_2>0,|\rho|<1\),则称 \((X,Y)\) 服从参数为 \((\mu_1,\mu_2;\sigma_1,\sigma_2;\rho)\)二元正态分布,记为 \((X,Y)\sim N(\mu_1,\mu_2;\sigma_1,\sigma_2;\rho)\)

3.4 随机变量的独立性

对任意两个实数集合 \(D_1 , D_2\) , 若

\[ P\{X\in D_1,Y\in D_2\}=P\{X\in D_1\}\cdot P\{Y\in D_2\} \]

则称随机变量 \(X, Y\) 相互独立, 简称 \(X, Y\) 独立.

也可以写为当且仅当对任意实数 \(x, y\) , 有

\[ P\{X\le x,Y\le y\}=P\{X\le x\}\cdot P\{Y\le y\} \]

成立, 即 \(F( x, y) = F_X(x) · F_Y(y )\) , \(X, Y\) 相互独立.

  • \((X,Y)\) 为二维离散型随机变量,设 \(X, Y\) 的可能取值为\(x_i,y_j , i, j = 1,2, ...\) , \(X\)\(Y\) 相互独立的定义等价于: 对于任意的实数 \(x_i,y_j\) 都有
\[ p_{ij}=p_{i\cdot} \cdot p_{\cdot j} \ \ \ \ i,j=1,2,... \]
  • \((X,Y)\) 为二维连续型随机变量,\(X\)\(Y\) 相互独立的定义等价于 \(f(x,y)=f_X(x)f_Y(y)\) 在除了面积为0的区域外处处成立

如果要说明独立性不成立,只需要找特例即可。

3.5 多元随机变量函数的分布

3.5.1 Z=X+Y 的分布

\((X, Y)\) 为二维离散型随机变量,设 \(P\{X = x_i, Y = y_j\} = p_{ij}, i, j = 1, 2, \cdots\),又设 \(Z\) 的可能取值为 \(z_1, z_2, \cdots, z_k, \cdots\),则显然有

\[ \begin{aligned} P\{Z = z_k\} &= P\{X + Y = z_k\} \\ &= \sum_{i=1}^{+\infty} P\{X = x_i, Y = z_k - x_i\} \quad k = 1, 2, \cdots \end{aligned} \tag{3.5.1} \]

\[ \begin{aligned} P\{Z = z_k\} &= P\{X + Y = z_k\}\\ &= \sum_{j=1}^{+\infty} P\{X = z_k - y_j, Y = y_j\} \quad k = 1, 2, \cdots \end{aligned} \tag{3.5.2} \]

特别地,当 \(X\)\(Y\) 相互独立时,(3.5.1) 与 (3.5.2) 就可写成

\[ P\{Z = z_k\} = \sum_{i=1}^{+\infty} P\{X = x_i\} \cdot P\{Y = z_k - x_i\} \quad k = 1, 2, \cdots \tag{3.5.3} \]

\[ P\{Z = z_k\} = \sum_{j=1}^{+\infty} P\{X = z_k - y_j\} \cdot P\{Y = y_j\}, \quad k = 1, 2, \cdots \tag{3.5.4} \]

\((X, Y)\) 为二维连续型随机变量,设 \((X, Y)\) 的联合密度函数为 \(f(x, y)\),则 \(Z\) 的分布函数为

\[ F_Z(z) = P\{Z \leq z\} = P\{X + Y \leq z\} \]
\[ \iint_{x+y \leq z} f(x, y) \, dx \, dy = \int_{-\infty}^{+\infty} dx \int_{-\infty}^{z-x} f(x, y) \, dy \]

如图3.5.1所示,作积分变量变换 \(\begin{cases} u = x, \\ v = x + y, \end{cases}\)可知 \(dx \, dy = du \, dv\),所以

\[ F_Z(z) = \int_{-\infty}^{z} dv \int_{-\infty}^{+\infty} f(u, v - u) \, du \]

从而

\[ f_Z(z) = F_Z'(z) = \int_{-\infty}^{+\infty} f(u, z - u) \, du = \int_{-\infty}^{+\infty} f(x, z - x) \, dx \tag{3.5.5} \]

若作的积分变量变换为 \(\begin{cases} u = x + y \\ v = y\end{cases}\),通过同样的计算可得

\[ f_Z(z) = \int_{-\infty}^{+\infty} f(z - y, y) \, dy \tag{3.5.6} \]

特别地,当 \(X, Y\) 相互独立时,(3.5.5) 与 (3.5.6) 就可写成

\[ f_Z(z) = \int_{-\infty}^{+\infty} f_X(x) \cdot f_Y(z - x) \, dx \tag{3.5.7} \]
\[ f_Z(z) = \int_{-\infty}^{+\infty} f_X(z - y) \cdot f_Y(y) \, dy \tag{3.5.8} \]

Note

已知 \(f(x,y),Z=X+Y\),求 \(f_Z(z)\) 步骤(\(X,Y \text{ 独立}\)

\[ f_Z(z)=\int_{-\infty}^{+\infty}f(x,z-x)\text{d}x=\int_{-\infty}^{+\infty}f_X(x)f_Y(z-x)\text{d}x \]
  1. 确定由 \(x\)\(z\) 构成的被积函数非零区域

  2. \(x\)\(z\) 作为坐标系统上,画出非零区域图形

  3. 根据 \(z\) 分段,在各段上对 \(x\) 求积分

离散变量的独立和分布

  1. \(X_1, X_2, \cdots, X_n\) 独立且均服从 $ B(1, p) $,则 \(X_1 + X_2 + \cdots + X_n \sim B(n, p)\)

  2. \(X \sim B(n_1, p), Y \sim B(n_2, p)\),两者独立,则 \(X + Y \sim B(n_1 + n_2, p)\)

  3. \(X \sim \pi(\lambda_1), Y \sim \pi(\lambda_2)\),两者独立,则 \(X + Y \sim \pi(\lambda_1 + \lambda_2)\)

n 个相互独立的正态变量之和仍为正态变量. 即若\(X_1 , X_2 , ... , X_n\) 相互独立, 且\(X_i\sim N(\mu_i,\sigma_i^2)\),则\(\sum_{i=1}^n\sim N(\sum_{i=1}^n\mu_i,\sum_{i=1}^n\sigma^2_i)\)

3.5.2 M=max{X,Y},N=min{X,Y} 的分布

\(X, Y\) 的联合分布函数为 \(F(x, y)\),且记 \(F_X(t), F_Y(t)\) 分别为 \(X, Y\) 的边际分布函数。

先来讨论 \(M\) 的分布函数,由 \(M\) 的定义可知

\[ F_M(t) = P\{\max\{X, Y\} \leq t\} = P\{X \leq t, Y \leq t\} = F(t, t) \]

特别地,当 \(X\)\(Y\) 相互独立时,

\[ F_M(t) = F_X(t) \cdot F_Y(t) \]

再讨论 \(N\) 的分布函数

\[ \begin{aligned} F_N(t) &= P\{\min\{X, Y\} \leq t\} \\&= P\{(X \leq t) \cup (Y \leq t)\} = F_X(t) + F_Y(t) - F(t, t) \end{aligned} \]

或者

\[ \begin{aligned} F_N(t) &= 1 - P\{\min\{X, Y\} > t\} \\&= 1 - P\{X > t, Y > t\} \end{aligned} \]

特别地,当 \(X\)\(Y\) 相互独立时,

\[ \begin{aligned} F_N(t) = F_X(t) + F_Y(t) - F_X(t) \cdot F_Y(t) \end{aligned} \]

\[ F_N(t) = 1 - [1 - F_X(t)] \cdot [1 - F_Y(t)] \]

以上结果容易推广到 \(n\) 个变量的情形。特别地,设 \(X_1, X_2, \cdots, X_n\)\(n\) 个相互独立的随机变量,相应的分布函数分别为 \(F_1(x), F_2(x), \cdots, F_n(x)\),记 \(M = \max\{X_1, X_2, \cdots, X_n\}\)\(N = \min\{X_1, X_2, \cdots, X_n\}\),则

\[ F_M(t) = \prod_{i=1}^n F_i(t) \]
\[ F_N(t) = 1 - \prod_{i=1}^n [1 - F_i(t)] \]

评论区

对你有帮助的话请给我个赞和 star => GitHub stars
欢迎跟我探讨!!!