概率论基础教程第5章 连续型随机变量(一)
第5章 连续型随机变量
5.1 分布函数与概率密度
定义
在第4章中,我们讨论了离散型随机变量,即随机变量的可能取值集合是有限的或可数无限的。然而,还存在一类随机变量,它们的可能取值集合是不可数的。例如:
- 火车到达某个车站的时间
- 某个晶体管的寿命
- 一根棍子随机断裂点的位置
定义:设 XXX 是一个随机变量,如果存在一个定义在实数轴上的非负函数 fff,使得对于任意实数集 BBB,满足:
P{X∈B}=∫Bf(x) dx(1.1) \boxed{P\{X \in B\} = \int_B f(x) \, \mathrm{d}x} \tag{1.1} P{X∈B}=∫Bf(x)dx(1.1)
则称 XXX 为连续型随机变量。函数 fff 称为随机变量 XXX 的概率密度函数(probability density function,PDF)。
[!NOTE]
概率密度函数 f(x)f(x)f(x) 本身不是概率,但概率可以通过 f(x)f(x)f(x) 在区间上的积分得到。
性质
-
非负性:f(x)≥0f(x) \geq 0f(x)≥0 对所有 xxx 成立
-
归一性:∫−∞+∞f(x) dx=1\int_{-\infty}^{+\infty} f(x) \, \mathrm{d}x = 1∫−∞+∞f(x)dx=1
- 这是因为 XXX 必须取某个值,所以总概率为 1
-
区间概率:对任意区间 [a,b][a, b][a,b],
P{a⩽X⩽b}=∫abf(x) dx(1.2) \boxed{P\{a \leqslant X \leqslant b\} = \int_{a}^{b} f(x) \, \mathrm{d}x} \tag{1.2} P{a⩽X⩽b}=∫abf(x)dx(1.2) -
单点概率为零:
P{X=a}=∫aaf(x) dx=0 P\{X = a\} = \int_a^a f(x) \, \mathrm{d}x = 0 P{X=a}=∫aaf(x)dx=0- 这表明连续型随机变量取任何固定值的概率都等于 0
- 因此,P{X<a}=P{X⩽a}=F(a)P\{X < a\} = P\{X \leqslant a\} = F(a)P{X<a}=P{X⩽a}=F(a),其中 FFF 是分布函数
-
密度函数的直观解释:
-
对于很小的 ε\varepsilonε,有:
P{a−ε2⩽X⩽a+ε2}≈εf(a) P\Big\{a-\frac{\varepsilon}{2}\leqslant X\leqslant a+\frac{\varepsilon}{2}\Big\} \approx \varepsilon f(a) P{a−2ε⩽X⩽a+2ε}≈εf(a) -
这表明 f(a)f(a)f(a) 是随机变量在点 aaa 附近取值可能性的一个度量
-
关系
分布函数 F(a)F(a)F(a) 定义为:
F(a)=P{X⩽a}=∫−∞af(x) dx
F(a) = P\{X \leqslant a\} = \int_{-\infty}^{a} f(x) \, \mathrm{d}x
F(a)=P{X⩽a}=∫−∞af(x)dx
对分布函数求导,得到:
ddaF(a)=f(a)
\boxed{\frac{\mathrm{d}}{\mathrm{d}a}F(a) = f(a)}
dadF(a)=f(a)
即密度函数是分布函数的导数。
例题
例 1a:设 XXX 是一个连续型随机变量,其密度函数为
f(x)={C(4x−2x2)0<x<20其他
f(x) = \begin{cases}
C(4x - 2x^2) & 0 < x < 2 \\
0 & \text{其他}
\end{cases}
f(x)={C(4x−2x2)00<x<2其他
(a) 求 CCC 的值
由于 f(x)f(x)f(x) 是概率密度函数,必须满足归一性条件:
∫−∞+∞f(x) dx=1
\int_{-\infty}^{+\infty} f(x) \, \mathrm{d}x = 1
∫−∞+∞f(x)dx=1
计算:
∫−∞+∞f(x) dx=∫02C(4x−2x2) dx=C∫02(4x−2x2) dx=C[2x2−2x33]02=C(2⋅4−2⋅83)=C(8−163)=C⋅83
\begin{aligned}
\int_{-\infty}^{+\infty} f(x) \, \mathrm{d}x &= \int_{0}^{2} C(4x - 2x^2) \, \mathrm{d}x \\
&= C \int_{0}^{2} (4x - 2x^2) \, \mathrm{d}x \\
&= C \left[ 2x^2 - \frac{2x^3}{3} \right]_{0}^{2} \\
&= C \left( 2 \cdot 4 - \frac{2 \cdot 8}{3} \right) \\
&= C \left( 8 - \frac{16}{3} \right) \\
&= C \cdot \frac{8}{3}
\end{aligned}
∫−∞+∞f(x)dx=∫02C(4x−2x2)dx=C∫02(4x−2x2)dx=C[2x2−32x3]02=C(2⋅4−32⋅8)=C(8−316)=C⋅38
令其等于 1:
C⋅83=1⇒C=38
C \cdot \frac{8}{3} = 1 \quad \Rightarrow \quad C = \frac{3}{8}
C⋅38=1⇒C=83
(b) 求 P{X>1}P\{X > 1\}P{X>1}
P{X>1}=∫1∞f(x) dx=∫1238(4x−2x2) dx=38∫12(4x−2x2) dx=38[2x2−2x33]12=38[(8−163)−(2−23)]=38[83−43]=38⋅43=12 \begin{aligned} P\{X > 1\} &= \int_{1}^{\infty} f(x) \, \mathrm{d}x \\ &= \int_{1}^{2} \frac{3}{8} (4x - 2x^2) \, \mathrm{d}x \\ &= \frac{3}{8} \int_{1}^{2} (4x - 2x^2) \, \mathrm{d}x \\ &= \frac{3}{8} \left[ 2x^2 - \frac{2x^3}{3} \right]_{1}^{2} \\ &= \frac{3}{8} \left[ \left(8 - \frac{16}{3}\right) - \left(2 - \frac{2}{3}\right) \right] \\ &= \frac{3}{8} \left[ \frac{8}{3} - \frac{4}{3} \right] \\ &= \frac{3}{8} \cdot \frac{4}{3} = \frac{1}{2} \end{aligned} P{X>1}=∫1∞f(x)dx=∫1283(4x−2x2)dx=83∫12(4x−2x2)dx=83[2x2−32x3]12=83[(8−316)−(2−32)]=83[38−34]=83⋅34=21
例 1b:某台计算机在系统崩溃之前连续运行的时间(以小时为单位)是一个连续型随机变量,其密度函数为
f(x)={λe−x/100x≥00x<0
f(x) = \begin{cases}
\lambda e^{-x/100} & x \geq 0 \\
0 & x < 0
\end{cases}
f(x)={λe−x/1000x≥0x<0
(a) 计算计算机在系统崩溃之前运行 50~150 小时的概率
首先确定 λ\lambdaλ:
1=∫−∞+∞f(x) dx=λ∫0+∞e−x/100 dx=λ[−100e−x/100]0∞=λ⋅100
\begin{aligned}
1 &= \int_{-\infty}^{+\infty} f(x) \, \mathrm{d}x \\
&= \lambda \int_{0}^{+\infty} e^{-x/100} \, \mathrm{d}x \\
&= \lambda \left[ -100e^{-x/100} \right]_{0}^{\infty} \\
&= \lambda \cdot 100
\end{aligned}
1=∫−∞+∞f(x)dx=λ∫0+∞e−x/100dx=λ[−100e−x/100]0∞=λ⋅100
所以 λ=1100\lambda = \frac{1}{100}λ=1001。
现在计算概率:
P{50<X<150}=∫501501100e−x/100 dx=[−e−x/100]50150=−e−150/100+e−50/100=e−1/2−e−3/2≈0.383
\begin{aligned}
P\{50 < X < 150\} &= \int_{50}^{150} \frac{1}{100} e^{-x/100} \, \mathrm{d}x \\
&= \left[ -e^{-x/100} \right]_{50}^{150} \\
&= -e^{-150/100} + e^{-50/100} \\
&= e^{-1/2} - e^{-3/2} \approx 0.383
\end{aligned}
P{50<X<150}=∫501501001e−x/100dx=[−e−x/100]50150=−e−150/100+e−50/100=e−1/2−e−3/2≈0.383
(b) 计算运行时间不超过 100 小时的概率
P{X<100}=∫01001100e−x/100 dx=[−e−x/100]0100=−e−1+1=1−e−1≈0.632
\begin{aligned}
P\{X < 100\} &= \int_{0}^{100} \frac{1}{100} e^{-x/100} \, \mathrm{d}x \\
&= \left[ -e^{-x/100} \right]_{0}^{100} \\
&= -e^{-1} + 1 \\
&= 1 - e^{-1} \approx 0.632
\end{aligned}
P{X<100}=∫01001001e−x/100dx=[−e−x/100]0100=−e−1+1=1−e−1≈0.632
例 1c:某种收音机电子管的寿命是一连续型随机变量,概率密度函数为
f(x)={0x≤100100x2x>100
f(x) = \begin{cases}
0 & x \leq 100 \\
\frac{100}{x^2} & x > 100
\end{cases}
f(x)={0x2100x≤100x>100
设共有 5 个同样的电子管,并且各个电子管的寿命相互独立,问在 150 小时内,这 5 个电子管中恰好有 2 个需要更换的概率是多大?
首先计算单个电子管在 150 小时内需要更换的概率:
P(Ei)=P{X≤150}=∫0150f(x) dx=∫100150100x2 dx=100[−1x]100150=100(−1150+1100)=100(1300)=13
\begin{aligned}
P(E_i) &= P\{X \leq 150\} \\
&= \int_{0}^{150} f(x) \, \mathrm{d}x \\
&= \int_{100}^{150} \frac{100}{x^2} \, \mathrm{d}x \\
&= 100 \left[ -\frac{1}{x} \right]_{100}^{150} \\
&= 100 \left( -\frac{1}{150} + \frac{1}{100} \right) \\
&= 100 \left( \frac{1}{300} \right) = \frac{1}{3}
\end{aligned}
P(Ei)=P{X≤150}=∫0150f(x)dx=∫100150x2100dx=100[−x1]100150=100(−1501+1001)=100(3001)=31
由于 5 个电子管的寿命相互独立,这是一个二项分布问题:
P{恰好有 2 个需要更换}=(52)(13)2(23)3=80243
P\{\text{恰好有 2 个需要更换}\} = \binom{5}{2} \left(\frac{1}{3}\right)^2 \left(\frac{2}{3}\right)^3 = \frac{80}{243}
P{恰好有 2 个需要更换}=(25)(31)2(32)3=24380
例 1d:设 XXX 是一个连续型随机变量,其分布函数为 FXF_XFX,密度函数为 fXf_XfX,求 Y=2XY = 2XY=2X 的密度函数。
方法一:通过分布函数
首先求 YYY 的分布函数:
FY(a)=P{Y≤a}=P{2X≤a}=P{X≤a/2}=FX(a/2)
F_Y(a) = P\{Y \leq a\} = P\{2X \leq a\} = P\{X \leq a/2\} = F_X(a/2)
FY(a)=P{Y≤a}=P{2X≤a}=P{X≤a/2}=FX(a/2)
对分布函数求导得到密度函数:
fY(a)=ddaFY(a)=ddaFX(a/2)=12fX(a/2)
f_Y(a) = \frac{d}{da} F_Y(a) = \frac{d}{da} F_X(a/2) = \frac{1}{2} f_X(a/2)
fY(a)=dadFY(a)=dadFX(a/2)=21fX(a/2)
方法二:通过密度函数的直观解释
考虑小概率:
εfY(a)≈P{a−ε2⩽Y⩽a+ε2}=P{a−ε2⩽2X⩽a+ε2}=P{a2−ε4⩽X⩽a2+ε4}≈ε2fX(a/2)
\begin{aligned}
\varepsilon f_Y(a) &\approx P\Big\{a - \frac{\varepsilon}{2} \leqslant Y \leqslant a + \frac{\varepsilon}{2}\Big\} \\
&= P\Big\{a - \frac{\varepsilon}{2} \leqslant 2X \leqslant a + \frac{\varepsilon}{2}\Big\} \\
&= P\Big\{\frac{a}{2} - \frac{\varepsilon}{4} \leqslant X \leqslant \frac{a}{2} + \frac{\varepsilon}{4}\Big\} \\
&\approx \frac{\varepsilon}{2} f_X(a/2)
\end{aligned}
εfY(a)≈P{a−2ε⩽Y⩽a+2ε}=P{a−2ε⩽2X⩽a+2ε}=P{2a−4ε⩽X⩽2a+4ε}≈2εfX(a/2)
两边除以 ε\varepsilonε 得:
fY(a)=12fX(a/2)
f_Y(a) = \frac{1}{2} f_X(a/2)
fY(a)=21fX(a/2)
[!IMPORTANT]
对于连续型随机变量 XXX 和很小的 ε\varepsilonε,有:
P{x−ε2⩽X⩽x+ε2}≈ε⋅fX(x) P\Big\{x - \frac{\varepsilon}{2} \leqslant X \leqslant x + \frac{\varepsilon}{2}\Big\} \approx \varepsilon \cdot f_X(x) P{x−2ε⩽X⩽x+2ε}≈ε⋅fX(x)这个公式表示:随机变量 XXX 落在以 xxx 为中心、长度为 ε\varepsilonε 的区间内的概率,近似等于 ε\varepsilonε 乘以 fX(x)f_X(x)fX(x)
P{a2−ε4⩽X⩽a2+ε4}≈(ε2)⋅fX(a2) P\Big\{\frac{a}{2} - \frac{\varepsilon}{4} \leqslant X \leqslant \frac{a}{2} + \frac{\varepsilon}{4}\Big\} \approx \left(\frac{\varepsilon}{2}\right) \cdot f_X\left(\frac{a}{2}\right) P{2a−4ε⩽X⩽2a+4ε}≈(2ε)⋅fX(2a)
代表XXX 落在区间 [a2−ε4,a2+ε4]\left[\frac{a}{2} - \frac{\varepsilon}{4}, \frac{a}{2} + \frac{\varepsilon}{4}\right][2a−4ε,2a+4ε] 内的概率。
这个区间的长度是:
(a2+ε4)−(a2−ε4)=ε2 \left(\frac{a}{2} + \frac{\varepsilon}{4}\right) - \left(\frac{a}{2} - \frac{\varepsilon}{4}\right) = \frac{\varepsilon}{2} (2a+4ε)−(2a−4ε)=2ε
两种方法得到相同结果。
5.2 连续型随机变量的期望和方差
定义
对于离散型随机变量,期望定义为:
E[X]=∑xP{X=x}
E[X] = \sum x P\{X = x\}
E[X]=∑xP{X=x}
对于连续型随机变量,由于 P{X=x}=0P\{X = x\} = 0P{X=x}=0,我们需要用积分来定义期望:
E[X]=∫−∞∞xf(x) dx \boxed{E[X] = \int_{-\infty}^{\infty} x f(x) \, \mathrm{d}x} E[X]=∫−∞∞xf(x)dx
随机变量函数的期望
类似于离散型情形,我们有:
命题 2.1:设 XXX 是一个连续型随机变量,其概率密度函数为 f(x)f(x)f(x),那么对于任一实值函数 ggg,有
E[g(X)]=∫−∞+∞g(x)f(x) dx
\boxed{E[g(X)] = \int_{-\infty}^{+\infty} g(x) f(x) \, \mathrm{d}x}
E[g(X)]=∫−∞+∞g(x)f(x)dx
例 2a:设随机变量 XXX 的密度函数为
f(x)={2x0≤x≤10其他
f(x) = \begin{cases}
2x & 0 \leq x \leq 1 \\
0 & \text{其他}
\end{cases}
f(x)={2x00≤x≤1其他
求 E[X]E[X]E[X]。
E[X]=∫−∞∞xf(x) dx=∫01x⋅2x dx=∫012x2 dx=[23x3]01=23 \begin{aligned} E[X] &= \int_{-\infty}^{\infty} x f(x) \, \mathrm{d}x \\ &= \int_{0}^{1} x \cdot 2x \, \mathrm{d}x \\ &= \int_{0}^{1} 2x^2 \, \mathrm{d}x \\ &= \left[ \frac{2}{3} x^3 \right]_{0}^{1} \\ &= \frac{2}{3} \end{aligned} E[X]=∫−∞∞xf(x)dx=∫01x⋅2xdx=∫012x2dx=[32x3]01=32
例 2b:设随机变量 XXX 的密度函数为
f(x)={10<x<10其他
f(x) = \begin{cases}
1 & 0 < x < 1 \\
0 & \text{其他}
\end{cases}
f(x)={100<x<1其他
求 E[eX]E[e^X]E[eX]。
方法一:先求 Y=eXY = e^XY=eX 的分布
对 1≤y≤e1 \leq y \leq e1≤y≤e:
FY(y)=P{Y≤y}=P{eX≤y}=P{X≤ln(y)}=∫0ln(y)f(x) dx=ln(y)
\begin{aligned}
F_Y(y) &= P\{Y \leq y\} = P\{e^X \leq y\} \\
&= P\{X \leq \ln(y)\} \\
&= \int_{0}^{\ln(y)} f(x) \, \mathrm{d}x \\
&= \ln(y)
\end{aligned}
FY(y)=P{Y≤y}=P{eX≤y}=P{X≤ln(y)}=∫0ln(y)f(x)dx=ln(y)
对 FY(y)F_Y(y)FY(y) 求导:
fY(y)=ddyln(y)=1y,1≤y≤e
f_Y(y) = \frac{d}{dy} \ln(y) = \frac{1}{y}, \quad 1 \leq y \leq e
fY(y)=dydln(y)=y1,1≤y≤e
因此:
E[eX]=E[Y]=∫−∞∞yfY(y) dy=∫1ey⋅1y dy=∫1e1 dy=e−1
\begin{aligned}
E[e^X] &= E[Y] = \int_{-\infty}^{\infty} y f_Y(y) \, \mathrm{d}y \\
&= \int_{1}^{e} y \cdot \frac{1}{y} \, \mathrm{d}y \\
&= \int_{1}^{e} 1 \, \mathrm{d}y = e - 1
\end{aligned}
E[eX]=E[Y]=∫−∞∞yfY(y)dy=∫1ey⋅y1dy=∫1e1dy=e−1
方法二:使用命题 2.1
E[eX]=∫−∞∞exf(x) dx=∫01ex⋅1 dx=[ex]01=e−1 \begin{aligned} E[e^X] &= \int_{-\infty}^{\infty} e^x f(x) \, \mathrm{d}x \\ &= \int_{0}^{1} e^x \cdot 1 \, \mathrm{d}x \\ &= \left[ e^x \right]_{0}^{1} = e - 1 \end{aligned} E[eX]=∫−∞∞exf(x)dx=∫01ex⋅1dx=[ex]01=e−1
两种方法得到相同结果。
例 2c:一根长为 1 的棍子在点 UUU 处断开,其中 UUU 是密度函数为 f(u)=1f(u) = 1f(u)=1 (0<u<10 < u < 10<u<1) 的随机变量,求包含点 ppp (0≤p≤10 \leq p \leq 10≤p≤1) 的那一截的长度的期望值。
令 Lp(U)L_p(U)Lp(U) 表示包含点 ppp 的那一截的长度:
Lp(U)={1−UU<pUU>p
L_p(U) = \begin{cases}
1-U & U < p \\
U & U > p
\end{cases}
Lp(U)={1−UUU<pU>p
利用命题 2.1:
E[Lp(U)]=∫01Lp(u) du=∫0p(1−u) du+∫p1u du=[u−u22]0p+[u22]p1=(p−p22)+(12−p22)=p−p2+12=12+p(1−p)
\begin{aligned}
E[L_p(U)] &= \int_{0}^{1} L_p(u) \, \mathrm{d}u \\
&= \int_{0}^{p} (1-u) \, \mathrm{d}u + \int_{p}^{1} u \, \mathrm{d}u \\
&= \left[ u - \frac{u^2}{2} \right]_{0}^{p} + \left[ \frac{u^2}{2} \right]_{p}^{1} \\
&= \left( p - \frac{p^2}{2} \right) + \left( \frac{1}{2} - \frac{p^2}{2} \right) \\
&= p - p^2 + \frac{1}{2} \\
&= \frac{1}{2} + p(1-p)
\end{aligned}
E[Lp(U)]=∫01Lp(u)du=∫0p(1−u)du+∫p1udu=[u−2u2]0p+[2u2]p1=(p−2p2)+(21−2p2)=p−p2+21=21+p(1−p)
因为 p(1−p)p(1-p)p(1−p) 在 p=12p = \frac{1}{2}p=21 时取最大值,所以当 ppp 是棍子的中点时,包含点 ppp 的那一截的长度的期望取得最大值。
例 2d:假设你去赴约,如果早到 sss 分钟,那么需要花费 cscscs 元,如果晚到 sss 分钟,则需要花费 ksksks 元。又假设从你所在地点到约会地点所要花费的时间是一个概率密度函数为 fff 的随机变量,问如果要使得花费的期望值最小,你应该什么时候出发?
令 XXX 表示路途所花时间,如果在约会前 ttt 分钟出发,那么花费 Ct(X)C_t(X)Ct(X) 为:
Ct(X)={c(t−X)if X≤tk(X−t)if X≥t
C_{t}(X) = \begin{cases}
c(t - X) & \text{if } X \leq t \\
k(X - t) & \text{if } X \geq t
\end{cases}
Ct(X)={c(t−X)k(X−t)if X≤tif X≥t
期望花费:
E[Ct(X)]=∫0∞Ct(x)f(x) dx=∫0tc(t−x)f(x) dx+∫t∞k(x−t)f(x) dx=ctF(t)−c∫0txf(x) dx+k∫t∞xf(x) dx−kt(1−F(t))
\begin{aligned}
E[C_{t}(X)] &= \int_{0}^{\infty} C_{t}(x) f(x) \, \mathrm{d}x \\
&= \int_{0}^{t} c(t - x) f(x) \, \mathrm{d}x + \int_{t}^{\infty} k(x - t) f(x) \, \mathrm{d}x \\
&= ct F(t) - c \int_{0}^{t} x f(x) \, \mathrm{d}x + k \int_{t}^{\infty} x f(x) \, \mathrm{d}x - kt (1 - F(t))
\end{aligned}
E[Ct(X)]=∫0∞Ct(x)f(x)dx=∫0tc(t−x)f(x)dx+∫t∞k(x−t)f(x)dx=ctF(t)−c∫0txf(x)dx+k∫t∞xf(x)dx−kt(1−F(t))
对 ttt 求导:
ddtE[Ct(X)]=cF(t)+ctf(t)−ctf(t)−k(1−F(t))+ktf(t)−ktf(t)=cF(t)−k(1−F(t))=(c+k)F(t)−k
\begin{aligned}
\frac{d}{dt}E[C_t(X)] &= cF(t) + ct f(t) - ct f(t) - k(1 - F(t)) + kt f(t) - kt f(t) \\
&= cF(t) - k(1 - F(t)) \\
&= (c + k)F(t) - k
\end{aligned}
dtdE[Ct(X)]=cF(t)+ctf(t)−ctf(t)−k(1−F(t))+ktf(t)−ktf(t)=cF(t)−k(1−F(t))=(c+k)F(t)−k
令导数等于 0:
(c+k)F(t∗)−k=0⇒F(t∗)=kk+c
(c + k)F(t^*) - k = 0 \quad \Rightarrow \quad F(t^*) = \frac{k}{k + c}
(c+k)F(t∗)−k=0⇒F(t∗)=k+ck
因此,在约会前 t∗t^*t∗ 分钟出发使得花费的期望值最小,其中 t∗t^*t∗ 满足 F(t∗)=kk+cF(t^*) = \frac{k}{k + c}F(t∗)=k+ck。
期望的性质
推论 2.1:如果 aaa 和 bbb 都是常数,那么
E[aX+b]=aE[X]+b
\boxed{E[aX + b] = aE[X] + b}
E[aX+b]=aE[X]+b
证明:
E[aX+b]=∫−∞∞(ax+b)f(x) dx=a∫−∞∞xf(x) dx+b∫−∞∞f(x) dx=aE[X]+b⋅1=aE[X]+b
\begin{aligned}
E[aX + b] &= \int_{-\infty}^{\infty} (ax + b) f(x) \, \mathrm{d}x \\
&= a \int_{-\infty}^{\infty} x f(x) \, \mathrm{d}x + b \int_{-\infty}^{\infty} f(x) \, \mathrm{d}x \\
&= aE[X] + b \cdot 1 \\
&= aE[X] + b
\end{aligned}
E[aX+b]=∫−∞∞(ax+b)f(x)dx=a∫−∞∞xf(x)dx+b∫−∞∞f(x)dx=aE[X]+b⋅1=aE[X]+b
方差
对于连续型随机变量,方差的定义与离散型相同:
Var(X)=E[(X−μ)2]其中μ=E[X] Var(X) = E[(X - \mu)^2] \quad \text{其中} \quad \mu = E[X] Var(X)=E[(X−μ)2]其中μ=E[X]
另一种等价计算公式:
Var(X)=E[X2]−(E[X])2
\boxed{Var(X) = E[X^2] - (E[X])^2}
Var(X)=E[X2]−(E[X])2
这个公式的证明与离散型情形一致:
Var(X)=E[(X−μ)2]=E[X2−2μX+μ2]=E[X2]−2μE[X]+μ2=E[X2]−2μ2+μ2=E[X2]−μ2
\begin{aligned}
Var(X) &= E[(X - \mu)^2] \\
&= E[X^2 - 2\mu X + \mu^2] \\
&= E[X^2] - 2\mu E[X] + \mu^2 \\
&= E[X^2] - 2\mu^2 + \mu^2 \\
&= E[X^2] - \mu^2
\end{aligned}
Var(X)=E[(X−μ)2]=E[X2−2μX+μ2]=E[X2]−2μE[X]+μ2=E[X2]−2μ2+μ2=E[X2]−μ2
对常数 aaa 和 bbb,有:
Var(aX+b)=a2Var(X)
Var(aX + b) = a^2 Var(X)
Var(aX+b)=a2Var(X)
证明:
Var(aX+b)=E[(aX+b−aμ−b)2]=E[a2(X−μ)2]=a2E[(X−μ)2]=a2Var(X)
\begin{aligned}
Var(aX + b) &= E[(aX + b - a\mu - b)^2] \\
&= E[a^2(X - \mu)^2] \\
&= a^2 E[(X - \mu)^2] \\
&= a^2 Var(X)
\end{aligned}
Var(aX+b)=E[(aX+b−aμ−b)2]=E[a2(X−μ)2]=a2E[(X−μ)2]=a2Var(X)
例题
例 2e:求例 2a 中随机变量 XXX 的方差 Var(X)Var(X)Var(X)。
首先计算 E[X2]E[X^2]E[X2]:
E[X2]=∫−∞∞x2f(x) dx=∫01x2⋅2x dx=∫012x3 dx=[12x4]01=12
\begin{aligned}
E[X^2] &= \int_{-\infty}^{\infty} x^2 f(x) \, \mathrm{d}x \\
&= \int_{0}^{1} x^2 \cdot 2x \, \mathrm{d}x \\
&= \int_{0}^{1} 2x^3 \, \mathrm{d}x \\
&= \left[ \frac{1}{2} x^4 \right]_{0}^{1} \\
&= \frac{1}{2}
\end{aligned}
E[X2]=∫−∞∞x2f(x)dx=∫01x2⋅2xdx=∫012x3dx=[21x4]01=21
已知 E[X]=23E[X] = \frac{2}{3}E[X]=32,所以:
Var(X)=E[X2]−(E[X])2=12−(23)2=12−49=118
\begin{aligned}
Var(X) &= E[X^2] - (E[X])^2 \\
&= \frac{1}{2} - \left(\frac{2}{3}\right)^2 \\
&= \frac{1}{2} - \frac{4}{9} \\
&= \frac{1}{18}
\end{aligned}
Var(X)=E[X2]−(E[X])2=21−(32)2=21−94=181
本节小结
连续型随机变量的核心概念
-
定义:如果存在非负函数 fff 使得 P{X∈B}=∫Bf(x) dxP\{X \in B\} = \int_B f(x) \, \mathrm{d}xP{X∈B}=∫Bf(x)dx,则 XXX 为连续型随机变量
-
概率密度函数 (PDF):
- f(x)≥0f(x) \geq 0f(x)≥0
- ∫−∞∞f(x) dx=1\int_{-\infty}^{\infty} f(x) \, \mathrm{d}x = 1∫−∞∞f(x)dx=1
- P{a≤X≤b}=∫abf(x) dxP\{a \leq X \leq b\} = \int_a^b f(x) \, \mathrm{d}xP{a≤X≤b}=∫abf(x)dx
- P{X=a}=0P\{X = a\} = 0P{X=a}=0 对任何 aaa
-
分布函数 (CDF):
- F(a)=P{X≤a}=∫−∞af(x) dxF(a) = P\{X \leq a\} = \int_{-\infty}^a f(x) \, \mathrm{d}xF(a)=P{X≤a}=∫−∞af(x)dx
- f(a)=ddaF(a)f(a) = \frac{d}{da} F(a)f(a)=dadF(a)
-
期望:
- E[X]=∫−∞∞xf(x) dxE[X] = \int_{-\infty}^{\infty} x f(x) \, \mathrm{d}xE[X]=∫−∞∞xf(x)dx
- E[g(X)]=∫−∞∞g(x)f(x) dxE[g(X)] = \int_{-\infty}^{\infty} g(x) f(x) \, \mathrm{d}xE[g(X)]=∫−∞∞g(x)f(x)dx
- E[aX+b]=aE[X]+bE[aX + b] = aE[X] + bE[aX+b]=aE[X]+b
-
方差:
- Var(X)=E[(X−E[X])2]=E[X2]−(E[X])2Var(X) = E[(X - E[X])^2] = E[X^2] - (E[X])^2Var(X)=E[(X−E[X])2]=E[X2]−(E[X])2
- Var(aX+b)=a2Var(X)Var(aX + b) = a^2 Var(X)Var(aX+b)=a2Var(X)
[!TIP]
连续型随机变量与离散型随机变量的主要区别在于:
- 离散型:概率通过求和计算,单点概率可能非零
- 连续型:概率通过积分计算,单点概率总是为零
但它们的期望和方差的定义和性质非常相似,只是将求和替换为积分。