当前位置：首页 > news >正文

概率论基础教程第5章连续型随机变量(一)

news 2025/8/20 9:16:14

第5章连续型随机变量

5.1 分布函数与概率密度

定义

在第4章中，我们讨论了离散型随机变量，即随机变量的可能取值集合是有限的或可数无限的。然而，还存在一类随机变量，它们的可能取值集合是不可数的。例如：

火车到达某个车站的时间
某个晶体管的寿命
一根棍子随机断裂点的位置

定义：设 $X$ 是一个随机变量，如果存在一个定义在实数轴上的非负函数 $f$ ，使得对于任意实数集 $B$ ，满足：

$\boxed{P\{X \in B\} = \int_B f(x) \, \mathrm{d}x} \tag{1.1}$

则称 $X$ 为连续型随机变量。函数 $f$ 称为随机变量 $X$ 的概率密度函数（probability density function，PDF）。

[!NOTE]
概率密度函数 $f (x)$ 本身不是概率，但概率可以通过 $f (x)$ 在区间上的积分得到。

性质

非负性： $\geq 0$ 对所有 $x$ 成立
归一性： $dx=1\int_{-\infty}^{+\infty} f(x) \, \mathrm{d}x = 1$
- 这是因为 $X$ 必须取某个值，所以总概率为 1
区间概率：对任意区间 $[a, b]$ ，
$\boxed{P\{a \leqslant X \leqslant b\} = \int_{a}^{b} f(x) \, \mathrm{d}x} \tag{1.2}$
单点概率为零：
$P\{X = a\} = \int_a^a f(x) \, \mathrm{d}x = 0$
- 这表明连续型随机变量取任何固定值的概率都等于 0
- 因此， $P{X<a}=P{X⩽a}=F(a)P\{X < a\} = P\{X \leqslant a\} = F(a)$ ，其中 $F$ 是分布函数
密度函数的直观解释：
- 对于很小的 $ε\varepsilon$ ，有：
  $P\Big\{a-\frac{\varepsilon}{2}\leqslant X\leqslant a+\frac{\varepsilon}{2}\Big\} \approx \varepsilon f(a)$
- 这表明 $f (a)$ 是随机变量在点 $a$ 附近取值可能性的一个度量

关系

分布函数 $F (a)$ 定义为：
$P\{X \leqslant a\} = \int_{-\infty}^{a} f(x) \, \mathrm{d}x$

对分布函数求导，得到：
$\boxed{\frac{\mathrm{d}}{\mathrm{d}a}F(a) = f(a)}$

即密度函数是分布函数的导数。

例题

例 1a：设 $X$ 是一个连续型随机变量，其密度函数为
$\begin{cases} C(4x - 2x^2) & 0 < x < 2 \\ 0 & \text{其他} \end{cases}$

(a) 求 $C$ 的值

由于 $f (x)$ 是概率密度函数，必须满足归一性条件：
$\int_{-\infty}^{+\infty} f(x) \, \mathrm{d}x = 1$

计算：
$\begin{aligned} \int_{-\infty}^{+\infty} f(x) \, \mathrm{d}x &= \int_{0}^{2} C(4x - 2x^2) \, \mathrm{d}x \\ &= C \int_{0}^{2} (4x - 2x^2) \, \mathrm{d}x \\ &= C \left[ 2x^2 - \frac{2x^3}{3} \right]_{0}^{2} \\ &= C \left( 2 \cdot 4 - \frac{2 \cdot 8}{3} \right) \\ &= C \left( 8 - \frac{16}{3} \right) \\ &= C \cdot \frac{8}{3} \end{aligned}$

令其等于 1：
$\cdot \frac{8}{3} = 1 \quad \Rightarrow \quad C = \frac{3}{8}$

(b) 求 $P\{X > 1\}$

$\begin{aligned} P\{X > 1\} &= \int_{1}^{\infty} f(x) \, \mathrm{d}x \\ &= \int_{1}^{2} \frac{3}{8} (4x - 2x^2) \, \mathrm{d}x \\ &= \frac{3}{8} \int_{1}^{2} (4x - 2x^2) \, \mathrm{d}x \\ &= \frac{3}{8} \left[ 2x^2 - \frac{2x^3}{3} \right]_{1}^{2} \\ &= \frac{3}{8} \left[ \left(8 - \frac{16}{3}\right) - \left(2 - \frac{2}{3}\right) \right] \\ &= \frac{3}{8} \left[ \frac{8}{3} - \frac{4}{3} \right] \\ &= \frac{3}{8} \cdot \frac{4}{3} = \frac{1}{2} \end{aligned}$

例 1b：某台计算机在系统崩溃之前连续运行的时间（以小时为单位）是一个连续型随机变量，其密度函数为
$\begin{cases} \lambda e^{-x/100} & x \geq 0 \\ 0 & x < 0 \end{cases}$

(a) 计算计算机在系统崩溃之前运行 50~150 小时的概率

首先确定 $λ\lambda$ ：
$\begin{aligned} 1 &= \int_{-\infty}^{+\infty} f(x) \, \mathrm{d}x \\ &= \lambda \int_{0}^{+\infty} e^{-x/100} \, \mathrm{d}x \\ &= \lambda \left[ -100e^{-x/100} \right]_{0}^{\infty} \\ &= \lambda \cdot 100 \end{aligned}$

所以 $λ=1100\lambda = \frac{1}{100}$ 。

现在计算概率：
$\begin{aligned} P\{50 < X < 150\} &= \int_{50}^{150} \frac{1}{100} e^{-x/100} \, \mathrm{d}x \\ &= \left[ -e^{-x/100} \right]_{50}^{150} \\ &= -e^{-150/100} + e^{-50/100} \\ &= e^{-1/2} - e^{-3/2} \approx 0.383 \end{aligned}$

(b) 计算运行时间不超过 100 小时的概率
$\begin{aligned} P\{X < 100\} &= \int_{0}^{100} \frac{1}{100} e^{-x/100} \, \mathrm{d}x \\ &= \left[ -e^{-x/100} \right]_{0}^{100} \\ &= -e^{-1} + 1 \\ &= 1 - e^{-1} \approx 0.632 \end{aligned}$

例 1c：某种收音机电子管的寿命是一连续型随机变量，概率密度函数为
$\begin{cases} 0 & x \leq 100 \\ \frac{100}{x^2} & x > 100 \end{cases}$

设共有 5 个同样的电子管，并且各个电子管的寿命相互独立，问在 150 小时内，这 5 个电子管中恰好有 2 个需要更换的概率是多大？

首先计算单个电子管在 150 小时内需要更换的概率：
$\begin{aligned} P(E_i) &= P\{X \leq 150\} \\ &= \int_{0}^{150} f(x) \, \mathrm{d}x \\ &= \int_{100}^{150} \frac{100}{x^2} \, \mathrm{d}x \\ &= 100 \left[ -\frac{1}{x} \right]_{100}^{150} \\ &= 100 \left( -\frac{1}{150} + \frac{1}{100} \right) \\ &= 100 \left( \frac{1}{300} \right) = \frac{1}{3} \end{aligned}$

由于 5 个电子管的寿命相互独立，这是一个二项分布问题：
$P\{\text{恰好有 2 个需要更换}\} = \binom{5}{2} \left(\frac{1}{3}\right)^2 \left(\frac{2}{3}\right)^3 = \frac{80}{243}$

例 1d：设 $X$ 是一个连续型随机变量，其分布函数为 $F_X$ ，密度函数为 $f_X$ ，求 $Y = 2 X$ 的密度函数。

方法一：通过分布函数

首先求 $Y$ 的分布函数：
$F_Y(a) = P\{Y \leq a\} = P\{2X \leq a\} = P\{X \leq a/2\} = F_X(a/2)$

对分布函数求导得到密度函数：
$f_Y(a) = \frac{d}{da} F_Y(a) = \frac{d}{da} F_X(a/2) = \frac{1}{2} f_X(a/2)$

方法二：通过密度函数的直观解释

考虑小概率：
$\begin{aligned} \varepsilon f_Y(a) &\approx P\Big\{a - \frac{\varepsilon}{2} \leqslant Y \leqslant a + \frac{\varepsilon}{2}\Big\} \\ &= P\Big\{a - \frac{\varepsilon}{2} \leqslant 2X \leqslant a + \frac{\varepsilon}{2}\Big\} \\ &= P\Big\{\frac{a}{2} - \frac{\varepsilon}{4} \leqslant X \leqslant \frac{a}{2} + \frac{\varepsilon}{4}\Big\} \\ &\approx \frac{\varepsilon}{2} f_X(a/2) \end{aligned}$

两边除以 $ε\varepsilon$ 得：
$f_Y(a) = \frac{1}{2} f_X(a/2)$

[!IMPORTANT]

对于连续型随机变量 $X$ 和很小的 $ε\varepsilon$ ，有：
$P\Big\{x - \frac{\varepsilon}{2} \leqslant X \leqslant x + \frac{\varepsilon}{2}\Big\} \approx \varepsilon \cdot f_X(x)$

这个公式表示：随机变量 $X$ 落在以 $x$ 为中心、长度为 $ε\varepsilon$ 的区间内的概率，近似等于 $ε\varepsilon$ 乘以 $f_X(x)$

$P\Big\{\frac{a}{2} - \frac{\varepsilon}{4} \leqslant X \leqslant \frac{a}{2} + \frac{\varepsilon}{4}\Big\} \approx \left(\frac{\varepsilon}{2}\right) \cdot f_X\left(\frac{a}{2}\right)$

代表 $X$ 落在区间 $[a2−ε4,a2+ε4]\left[\frac{a}{2} - \frac{\varepsilon}{4}, \frac{a}{2} + \frac{\varepsilon}{4}\right]$ 内的概率。

这个区间的长度是：
$\left(\frac{a}{2} + \frac{\varepsilon}{4}\right) - \left(\frac{a}{2} - \frac{\varepsilon}{4}\right) = \frac{\varepsilon}{2}$

两种方法得到相同结果。

5.2 连续型随机变量的期望和方差

定义

对于离散型随机变量，期望定义为：
$\sum x P\{X = x\}$

对于连续型随机变量，由于 $P\{X = x\} = 0$ ，我们需要用积分来定义期望：

$\boxed{E[X] = \int_{-\infty}^{\infty} x f(x) \, \mathrm{d}x}$

随机变量函数的期望

类似于离散型情形，我们有：

命题 2.1：设 $X$ 是一个连续型随机变量，其概率密度函数为 $f (x)$ ，那么对于任一实值函数 $g$ ，有
$\boxed{E[g(X)] = \int_{-\infty}^{+\infty} g(x) f(x) \, \mathrm{d}x}$

例 2a：设随机变量 $X$ 的密度函数为
$\begin{cases} 2x & 0 \leq x \leq 1 \\ 0 & \text{其他} \end{cases}$

求 $E [X]$ 。

$\begin{aligned} E[X] &= \int_{-\infty}^{\infty} x f(x) \, \mathrm{d}x \\ &= \int_{0}^{1} x \cdot 2x \, \mathrm{d}x \\ &= \int_{0}^{1} 2x^2 \, \mathrm{d}x \\ &= \left[ \frac{2}{3} x^3 \right]_{0}^{1} \\ &= \frac{2}{3} \end{aligned}$

例 2b：设随机变量 $X$ 的密度函数为
$\begin{cases} 1 & 0 < x < 1 \\ 0 & \text{其他} \end{cases}$

求 $E[e^X]$ 。

方法一：先求 $Y = e^X$ 的分布

对 $\leq y \leq e$ ：
$\begin{aligned} F_Y(y) &= P\{Y \leq y\} = P\{e^X \leq y\} \\ &= P\{X \leq \ln(y)\} \\ &= \int_{0}^{\ln(y)} f(x) \, \mathrm{d}x \\ &= \ln(y) \end{aligned}$

对 $F_Y(y)$ 求导：
$f_Y(y) = \frac{d}{dy} \ln(y) = \frac{1}{y}, \quad 1 \leq y \leq e$

因此：
$\begin{aligned} E[e^X] &= E[Y] = \int_{-\infty}^{\infty} y f_Y(y) \, \mathrm{d}y \\ &= \int_{1}^{e} y \cdot \frac{1}{y} \, \mathrm{d}y \\ &= \int_{1}^{e} 1 \, \mathrm{d}y = e - 1 \end{aligned}$

方法二：使用命题 2.1

$\begin{aligned} E[e^X] &= \int_{-\infty}^{\infty} e^x f(x) \, \mathrm{d}x \\ &= \int_{0}^{1} e^x \cdot 1 \, \mathrm{d}x \\ &= \left[ e^x \right]_{0}^{1} = e - 1 \end{aligned}$

两种方法得到相同结果。

例 2c：一根长为 1 的棍子在点 $U$ 处断开，其中 $U$ 是密度函数为 $f (u) = 1$ ( $0 < u < 1$ ) 的随机变量，求包含点 $p$ ( $\leq p \leq 1$ ) 的那一截的长度的期望值。

令 $L_p(U)$ 表示包含点 $p$ 的那一截的长度：
$L_p(U) = \begin{cases} 1-U & U < p \\ U & U > p \end{cases}$

利用命题 2.1：
$\begin{aligned} E[L_p(U)] &= \int_{0}^{1} L_p(u) \, \mathrm{d}u \\ &= \int_{0}^{p} (1-u) \, \mathrm{d}u + \int_{p}^{1} u \, \mathrm{d}u \\ &= \left[ u - \frac{u^2}{2} \right]_{0}^{p} + \left[ \frac{u^2}{2} \right]_{p}^{1} \\ &= \left( p - \frac{p^2}{2} \right) + \left( \frac{1}{2} - \frac{p^2}{2} \right) \\ &= p - p^2 + \frac{1}{2} \\ &= \frac{1}{2} + p(1-p) \end{aligned}$

因为 $p (1 - p)$ 在 $\frac{1}{2}$ 时取最大值，所以当 $p$ 是棍子的中点时，包含点 $p$ 的那一截的长度的期望取得最大值。

例 2d：假设你去赴约，如果早到 $s$ 分钟，那么需要花费 $cs$ 元，如果晚到 $s$ 分钟，则需要花费 $k s$ 元。又假设从你所在地点到约会地点所要花费的时间是一个概率密度函数为 $f$ 的随机变量，问如果要使得花费的期望值最小，你应该什么时候出发？

令 $X$ 表示路途所花时间，如果在约会前 $t$ 分钟出发，那么花费 $C_t(X)$ 为：
$C_{t}(X) = \begin{cases} c(t - X) & \text{if } X \leq t \\ k(X - t) & \text{if } X \geq t \end{cases}$

期望花费：
$\begin{aligned} E[C_{t}(X)] &= \int_{0}^{\infty} C_{t}(x) f(x) \, \mathrm{d}x \\ &= \int_{0}^{t} c(t - x) f(x) \, \mathrm{d}x + \int_{t}^{\infty} k(x - t) f(x) \, \mathrm{d}x \\ &= ct F(t) - c \int_{0}^{t} x f(x) \, \mathrm{d}x + k \int_{t}^{\infty} x f(x) \, \mathrm{d}x - kt (1 - F(t)) \end{aligned}$

对 $t$ 求导：
$\begin{aligned} \frac{d}{dt}E[C_t(X)] &= cF(t) + ct f(t) - ct f(t) - k(1 - F(t)) + kt f(t) - kt f(t) \\ &= cF(t) - k(1 - F(t)) \\ &= (c + k)F(t) - k \end{aligned}$

令导数等于 0：
$k)F(t^*) - k = 0 \quad \Rightarrow \quad F(t^*) = \frac{k}{k + c}$

因此，在约会前 $t^*$ 分钟出发使得花费的期望值最小，其中 $t^*$ 满足 $F(t∗)=kk+cF(t^*) = \frac{k}{k + c}$ 。

期望的性质

推论 2.1：如果 $a$ 和 $b$ 都是常数，那么
$\boxed{E[aX + b] = aE[X] + b}$

证明：
$\begin{aligned} E[aX + b] &= \int_{-\infty}^{\infty} (ax + b) f(x) \, \mathrm{d}x \\ &= a \int_{-\infty}^{\infty} x f(x) \, \mathrm{d}x + b \int_{-\infty}^{\infty} f(x) \, \mathrm{d}x \\ &= aE[X] + b \cdot 1 \\ &= aE[X] + b \end{aligned}$

方差

对于连续型随机变量，方差的定义与离散型相同：

$\mu)^2] \quad \text{其中} \quad \mu = E[X]$

另一种等价计算公式：
$\boxed{Var(X) = E[X^2] - (E[X])^2}$

这个公式的证明与离散型情形一致：
$\begin{aligned} Var(X) &= E[(X - \mu)^2] \\ &= E[X^2 - 2\mu X + \mu^2] \\ &= E[X^2] - 2\mu E[X] + \mu^2 \\ &= E[X^2] - 2\mu^2 + \mu^2 \\ &= E[X^2] - \mu^2 \end{aligned}$

对常数 $a$ 和 $b$ ，有：
$Var(aX + b) = a^2 Var(X)$

证明：
$\begin{aligned} Var(aX + b) &= E[(aX + b - a\mu - b)^2] \\ &= E[a^2(X - \mu)^2] \\ &= a^2 E[(X - \mu)^2] \\ &= a^2 Var(X) \end{aligned}$

例题

例 2e：求例 2a 中随机变量 $X$ 的方差 $Va r (X)$ 。

首先计算 $E[X^2]$ ：
$\begin{aligned} E[X^2] &= \int_{-\infty}^{\infty} x^2 f(x) \, \mathrm{d}x \\ &= \int_{0}^{1} x^2 \cdot 2x \, \mathrm{d}x \\ &= \int_{0}^{1} 2x^3 \, \mathrm{d}x \\ &= \left[ \frac{1}{2} x^4 \right]_{0}^{1} \\ &= \frac{1}{2} \end{aligned}$

已知 $\frac{2}{3}$ ，所以：
$\begin{aligned} Var(X) &= E[X^2] - (E[X])^2 \\ &= \frac{1}{2} - \left(\frac{2}{3}\right)^2 \\ &= \frac{1}{2} - \frac{4}{9} \\ &= \frac{1}{18} \end{aligned}$

本节小结

连续型随机变量的核心概念

定义：如果存在非负函数 $f$ 使得 $dxP\{X \in B\} = \int_B f(x) \, \mathrm{d}x$ ，则 $X$ 为连续型随机变量
概率密度函数 (PDF)：
- $\geq 0$
- $dx=1\int_{-\infty}^{\infty} f(x) \, \mathrm{d}x = 1$
- $dxP\{a \leq X \leq b\} = \int_a^b f(x) \, \mathrm{d}x$
- $P\{X = a\} = 0$ 对任何 $a$
分布函数 (CDF)：
- $P\{X \leq a\} = \int_{-\infty}^a f(x) \, \mathrm{d}x$
- $\frac{d}{da} F(a)$
期望：
- $\int_{-\infty}^{\infty} x f(x) \, \mathrm{d}x$
- $\int_{-\infty}^{\infty} g(x) f(x) \, \mathrm{d}x$
- $E [a X + b] = a E [X] + b$
方差：
- $Var(X) = E[(X - E[X])^2] = E[X^2] - (E[X])^2$
- $Var(aX + b) = a^2 Var(X)$