当前位置: 首页 > news >正文

概率论基础教程第5章 连续型随机变量(一)

第5章 连续型随机变量

5.1 分布函数与概率密度

定义

在第4章中,我们讨论了离散型随机变量,即随机变量的可能取值集合是有限的可数无限的。然而,还存在一类随机变量,它们的可能取值集合是不可数的。例如:

  • 火车到达某个车站的时间
  • 某个晶体管的寿命
  • 一根棍子随机断裂点的位置

定义:设 XXX 是一个随机变量,如果存在一个定义在实数轴上的非负函数 fff,使得对于任意实数集 BBB,满足:

P{X∈B}=∫Bf(x) dx(1.1) \boxed{P\{X \in B\} = \int_B f(x) \, \mathrm{d}x} \tag{1.1} P{XB}=Bf(x)dx(1.1)

则称 XXX连续型随机变量。函数 fff 称为随机变量 XXX概率密度函数(probability density function,PDF)。

[!NOTE]
概率密度函数 f(x)f(x)f(x) 本身不是概率,但概率可以通过 f(x)f(x)f(x) 在区间上的积分得到。


性质

  1. 非负性f(x)≥0f(x) \geq 0f(x)0 对所有 xxx 成立

  2. 归一性∫−∞+∞f(x) dx=1\int_{-\infty}^{+\infty} f(x) \, \mathrm{d}x = 1+f(x)dx=1

    • 这是因为 XXX 必须取某个值,所以总概率为 1
  3. 区间概率:对任意区间 [a,b][a, b][a,b]
    P{a⩽X⩽b}=∫abf(x) dx(1.2) \boxed{P\{a \leqslant X \leqslant b\} = \int_{a}^{b} f(x) \, \mathrm{d}x} \tag{1.2} P{aXb}=abf(x)dx(1.2)

  4. 单点概率为零
    P{X=a}=∫aaf(x) dx=0 P\{X = a\} = \int_a^a f(x) \, \mathrm{d}x = 0 P{X=a}=aaf(x)dx=0

    • 这表明连续型随机变量取任何固定值的概率都等于 0
    • 因此,P{X<a}=P{X⩽a}=F(a)P\{X < a\} = P\{X \leqslant a\} = F(a)P{X<a}=P{Xa}=F(a),其中 FFF 是分布函数
  5. 密度函数的直观解释

    • 对于很小的 ε\varepsilonε,有:
      P{a−ε2⩽X⩽a+ε2}≈εf(a) P\Big\{a-\frac{\varepsilon}{2}\leqslant X\leqslant a+\frac{\varepsilon}{2}\Big\} \approx \varepsilon f(a) P{a2εXa+2ε}εf(a)

    • 这表明 f(a)f(a)f(a) 是随机变量在点 aaa 附近取值可能性的一个度量


关系

分布函数 F(a)F(a)F(a) 定义为:
F(a)=P{X⩽a}=∫−∞af(x) dx F(a) = P\{X \leqslant a\} = \int_{-\infty}^{a} f(x) \, \mathrm{d}x F(a)=P{Xa}=af(x)dx

对分布函数求导,得到:
ddaF(a)=f(a) \boxed{\frac{\mathrm{d}}{\mathrm{d}a}F(a) = f(a)} dadF(a)=f(a)

密度函数是分布函数的导数


例题

例 1a:设 XXX 是一个连续型随机变量,其密度函数为
f(x)={C(4x−2x2)0<x<20其他 f(x) = \begin{cases} C(4x - 2x^2) & 0 < x < 2 \\ 0 & \text{其他} \end{cases} f(x)={C(4x2x2)00<x<2其他

(a) 求 CCC 的值

由于 f(x)f(x)f(x) 是概率密度函数,必须满足归一性条件:
∫−∞+∞f(x) dx=1 \int_{-\infty}^{+\infty} f(x) \, \mathrm{d}x = 1 +f(x)dx=1

计算:
∫−∞+∞f(x) dx=∫02C(4x−2x2) dx=C∫02(4x−2x2) dx=C[2x2−2x33]02=C(2⋅4−2⋅83)=C(8−163)=C⋅83 \begin{aligned} \int_{-\infty}^{+\infty} f(x) \, \mathrm{d}x &= \int_{0}^{2} C(4x - 2x^2) \, \mathrm{d}x \\ &= C \int_{0}^{2} (4x - 2x^2) \, \mathrm{d}x \\ &= C \left[ 2x^2 - \frac{2x^3}{3} \right]_{0}^{2} \\ &= C \left( 2 \cdot 4 - \frac{2 \cdot 8}{3} \right) \\ &= C \left( 8 - \frac{16}{3} \right) \\ &= C \cdot \frac{8}{3} \end{aligned} +f(x)dx=02C(4x2x2)dx=C02(4x2x2)dx=C[2x232x3]02=C(24328)=C(8316)=C38

令其等于 1:
C⋅83=1⇒C=38 C \cdot \frac{8}{3} = 1 \quad \Rightarrow \quad C = \frac{3}{8} C38=1C=83

(b) 求 P{X>1}P\{X > 1\}P{X>1}

P{X>1}=∫1∞f(x) dx=∫1238(4x−2x2) dx=38∫12(4x−2x2) dx=38[2x2−2x33]12=38[(8−163)−(2−23)]=38[83−43]=38⋅43=12 \begin{aligned} P\{X > 1\} &= \int_{1}^{\infty} f(x) \, \mathrm{d}x \\ &= \int_{1}^{2} \frac{3}{8} (4x - 2x^2) \, \mathrm{d}x \\ &= \frac{3}{8} \int_{1}^{2} (4x - 2x^2) \, \mathrm{d}x \\ &= \frac{3}{8} \left[ 2x^2 - \frac{2x^3}{3} \right]_{1}^{2} \\ &= \frac{3}{8} \left[ \left(8 - \frac{16}{3}\right) - \left(2 - \frac{2}{3}\right) \right] \\ &= \frac{3}{8} \left[ \frac{8}{3} - \frac{4}{3} \right] \\ &= \frac{3}{8} \cdot \frac{4}{3} = \frac{1}{2} \end{aligned} P{X>1}=1f(x)dx=1283(4x2x2)dx=8312(4x2x2)dx=83[2x232x3]12=83[(8316)(232)]=83[3834]=8334=21


例 1b:某台计算机在系统崩溃之前连续运行的时间(以小时为单位)是一个连续型随机变量,其密度函数为
f(x)={λe−x/100x≥00x<0 f(x) = \begin{cases} \lambda e^{-x/100} & x \geq 0 \\ 0 & x < 0 \end{cases} f(x)={λex/1000x0x<0

(a) 计算计算机在系统崩溃之前运行 50~150 小时的概率

首先确定 λ\lambdaλ
1=∫−∞+∞f(x) dx=λ∫0+∞e−x/100 dx=λ[−100e−x/100]0∞=λ⋅100 \begin{aligned} 1 &= \int_{-\infty}^{+\infty} f(x) \, \mathrm{d}x \\ &= \lambda \int_{0}^{+\infty} e^{-x/100} \, \mathrm{d}x \\ &= \lambda \left[ -100e^{-x/100} \right]_{0}^{\infty} \\ &= \lambda \cdot 100 \end{aligned} 1=+f(x)dx=λ0+ex/100dx=λ[100ex/100]0=λ100

所以 λ=1100\lambda = \frac{1}{100}λ=1001

现在计算概率:
P{50<X<150}=∫501501100e−x/100 dx=[−e−x/100]50150=−e−150/100+e−50/100=e−1/2−e−3/2≈0.383 \begin{aligned} P\{50 < X < 150\} &= \int_{50}^{150} \frac{1}{100} e^{-x/100} \, \mathrm{d}x \\ &= \left[ -e^{-x/100} \right]_{50}^{150} \\ &= -e^{-150/100} + e^{-50/100} \\ &= e^{-1/2} - e^{-3/2} \approx 0.383 \end{aligned} P{50<X<150}=501501001ex/100dx=[ex/100]50150=e150/100+e50/100=e1/2e3/20.383

(b) 计算运行时间不超过 100 小时的概率
P{X<100}=∫01001100e−x/100 dx=[−e−x/100]0100=−e−1+1=1−e−1≈0.632 \begin{aligned} P\{X < 100\} &= \int_{0}^{100} \frac{1}{100} e^{-x/100} \, \mathrm{d}x \\ &= \left[ -e^{-x/100} \right]_{0}^{100} \\ &= -e^{-1} + 1 \\ &= 1 - e^{-1} \approx 0.632 \end{aligned} P{X<100}=01001001ex/100dx=[ex/100]0100=e1+1=1e10.632


例 1c:某种收音机电子管的寿命是一连续型随机变量,概率密度函数为
f(x)={0x≤100100x2x>100 f(x) = \begin{cases} 0 & x \leq 100 \\ \frac{100}{x^2} & x > 100 \end{cases} f(x)={0x2100x100x>100

设共有 5 个同样的电子管,并且各个电子管的寿命相互独立,问在 150 小时内,这 5 个电子管中恰好有 2 个需要更换的概率是多大?

首先计算单个电子管在 150 小时内需要更换的概率:
P(Ei)=P{X≤150}=∫0150f(x) dx=∫100150100x2 dx=100[−1x]100150=100(−1150+1100)=100(1300)=13 \begin{aligned} P(E_i) &= P\{X \leq 150\} \\ &= \int_{0}^{150} f(x) \, \mathrm{d}x \\ &= \int_{100}^{150} \frac{100}{x^2} \, \mathrm{d}x \\ &= 100 \left[ -\frac{1}{x} \right]_{100}^{150} \\ &= 100 \left( -\frac{1}{150} + \frac{1}{100} \right) \\ &= 100 \left( \frac{1}{300} \right) = \frac{1}{3} \end{aligned} P(Ei)=P{X150}=0150f(x)dx=100150x2100dx=100[x1]100150=100(1501+1001)=100(3001)=31

由于 5 个电子管的寿命相互独立,这是一个二项分布问题:
P{恰好有 2 个需要更换}=(52)(13)2(23)3=80243 P\{\text{恰好有 2 个需要更换}\} = \binom{5}{2} \left(\frac{1}{3}\right)^2 \left(\frac{2}{3}\right)^3 = \frac{80}{243} P{恰好有 2 个需要更换}=(25)(31)2(32)3=24380


例 1d:设 XXX 是一个连续型随机变量,其分布函数为 FXF_XFX,密度函数为 fXf_XfX,求 Y=2XY = 2XY=2X 的密度函数。

方法一:通过分布函数

首先求 YYY 的分布函数:
FY(a)=P{Y≤a}=P{2X≤a}=P{X≤a/2}=FX(a/2) F_Y(a) = P\{Y \leq a\} = P\{2X \leq a\} = P\{X \leq a/2\} = F_X(a/2) FY(a)=P{Ya}=P{2Xa}=P{Xa/2}=FX(a/2)

对分布函数求导得到密度函数:
fY(a)=ddaFY(a)=ddaFX(a/2)=12fX(a/2) f_Y(a) = \frac{d}{da} F_Y(a) = \frac{d}{da} F_X(a/2) = \frac{1}{2} f_X(a/2) fY(a)=dadFY(a)=dadFX(a/2)=21fX(a/2)

方法二:通过密度函数的直观解释

考虑小概率:
εfY(a)≈P{a−ε2⩽Y⩽a+ε2}=P{a−ε2⩽2X⩽a+ε2}=P{a2−ε4⩽X⩽a2+ε4}≈ε2fX(a/2) \begin{aligned} \varepsilon f_Y(a) &\approx P\Big\{a - \frac{\varepsilon}{2} \leqslant Y \leqslant a + \frac{\varepsilon}{2}\Big\} \\ &= P\Big\{a - \frac{\varepsilon}{2} \leqslant 2X \leqslant a + \frac{\varepsilon}{2}\Big\} \\ &= P\Big\{\frac{a}{2} - \frac{\varepsilon}{4} \leqslant X \leqslant \frac{a}{2} + \frac{\varepsilon}{4}\Big\} \\ &\approx \frac{\varepsilon}{2} f_X(a/2) \end{aligned} εfY(a)P{a2εYa+2ε}=P{a2ε2Xa+2ε}=P{2a4εX2a+4ε}2εfX(a/2)

两边除以 ε\varepsilonε 得:
fY(a)=12fX(a/2) f_Y(a) = \frac{1}{2} f_X(a/2) fY(a)=21fX(a/2)

[!IMPORTANT]

对于连续型随机变量 XXX 和很小的 ε\varepsilonε,有:
P{x−ε2⩽X⩽x+ε2}≈ε⋅fX(x) P\Big\{x - \frac{\varepsilon}{2} \leqslant X \leqslant x + \frac{\varepsilon}{2}\Big\} \approx \varepsilon \cdot f_X(x) P{x2εXx+2ε}εfX(x)

这个公式表示:随机变量 XXX 落在以 xxx 为中心、长度为 ε\varepsilonε 的区间内的概率,近似等于 ε\varepsilonε 乘以 fX(x)f_X(x)fX(x)

P{a2−ε4⩽X⩽a2+ε4}≈(ε2)⋅fX(a2) P\Big\{\frac{a}{2} - \frac{\varepsilon}{4} \leqslant X \leqslant \frac{a}{2} + \frac{\varepsilon}{4}\Big\} \approx \left(\frac{\varepsilon}{2}\right) \cdot f_X\left(\frac{a}{2}\right) P{2a4εX2a+4ε}(2ε)fX(2a)

代表XXX 落在区间 [a2−ε4,a2+ε4]\left[\frac{a}{2} - \frac{\varepsilon}{4}, \frac{a}{2} + \frac{\varepsilon}{4}\right][2a4ε,2a+4ε] 内的概率。

这个区间的长度是:
(a2+ε4)−(a2−ε4)=ε2 \left(\frac{a}{2} + \frac{\varepsilon}{4}\right) - \left(\frac{a}{2} - \frac{\varepsilon}{4}\right) = \frac{\varepsilon}{2} (2a+4ε)(2a4ε)=2ε

两种方法得到相同结果。


5.2 连续型随机变量的期望和方差

定义

对于离散型随机变量,期望定义为:
E[X]=∑xP{X=x} E[X] = \sum x P\{X = x\} E[X]=xP{X=x}

对于连续型随机变量,由于 P{X=x}=0P\{X = x\} = 0P{X=x}=0,我们需要用积分来定义期望:

E[X]=∫−∞∞xf(x) dx \boxed{E[X] = \int_{-\infty}^{\infty} x f(x) \, \mathrm{d}x} E[X]=xf(x)dx


随机变量函数的期望

类似于离散型情形,我们有:

命题 2.1:设 XXX 是一个连续型随机变量,其概率密度函数为 f(x)f(x)f(x),那么对于任一实值函数 ggg,有
E[g(X)]=∫−∞+∞g(x)f(x) dx \boxed{E[g(X)] = \int_{-\infty}^{+\infty} g(x) f(x) \, \mathrm{d}x} E[g(X)]=+g(x)f(x)dx

例 2a:设随机变量 XXX 的密度函数为
f(x)={2x0≤x≤10其他 f(x) = \begin{cases} 2x & 0 \leq x \leq 1 \\ 0 & \text{其他} \end{cases} f(x)={2x00x1其他

E[X]E[X]E[X]

E[X]=∫−∞∞xf(x) dx=∫01x⋅2x dx=∫012x2 dx=[23x3]01=23 \begin{aligned} E[X] &= \int_{-\infty}^{\infty} x f(x) \, \mathrm{d}x \\ &= \int_{0}^{1} x \cdot 2x \, \mathrm{d}x \\ &= \int_{0}^{1} 2x^2 \, \mathrm{d}x \\ &= \left[ \frac{2}{3} x^3 \right]_{0}^{1} \\ &= \frac{2}{3} \end{aligned} E[X]=xf(x)dx=01x2xdx=012x2dx=[32x3]01=32


例 2b:设随机变量 XXX 的密度函数为
f(x)={10<x<10其他 f(x) = \begin{cases} 1 & 0 < x < 1 \\ 0 & \text{其他} \end{cases} f(x)={100<x<1其他

E[eX]E[e^X]E[eX]

方法一:先求 Y=eXY = e^XY=eX 的分布

1≤y≤e1 \leq y \leq e1ye
FY(y)=P{Y≤y}=P{eX≤y}=P{X≤ln⁡(y)}=∫0ln⁡(y)f(x) dx=ln⁡(y) \begin{aligned} F_Y(y) &= P\{Y \leq y\} = P\{e^X \leq y\} \\ &= P\{X \leq \ln(y)\} \\ &= \int_{0}^{\ln(y)} f(x) \, \mathrm{d}x \\ &= \ln(y) \end{aligned} FY(y)=P{Yy}=P{eXy}=P{Xln(y)}=0ln(y)f(x)dx=ln(y)

FY(y)F_Y(y)FY(y) 求导:
fY(y)=ddyln⁡(y)=1y,1≤y≤e f_Y(y) = \frac{d}{dy} \ln(y) = \frac{1}{y}, \quad 1 \leq y \leq e fY(y)=dydln(y)=y1,1ye

因此:
E[eX]=E[Y]=∫−∞∞yfY(y) dy=∫1ey⋅1y dy=∫1e1 dy=e−1 \begin{aligned} E[e^X] &= E[Y] = \int_{-\infty}^{\infty} y f_Y(y) \, \mathrm{d}y \\ &= \int_{1}^{e} y \cdot \frac{1}{y} \, \mathrm{d}y \\ &= \int_{1}^{e} 1 \, \mathrm{d}y = e - 1 \end{aligned} E[eX]=E[Y]=yfY(y)dy=1eyy1dy=1e1dy=e1

方法二:使用命题 2.1

E[eX]=∫−∞∞exf(x) dx=∫01ex⋅1 dx=[ex]01=e−1 \begin{aligned} E[e^X] &= \int_{-\infty}^{\infty} e^x f(x) \, \mathrm{d}x \\ &= \int_{0}^{1} e^x \cdot 1 \, \mathrm{d}x \\ &= \left[ e^x \right]_{0}^{1} = e - 1 \end{aligned} E[eX]=exf(x)dx=01ex1dx=[ex]01=e1

两种方法得到相同结果。


例 2c:一根长为 1 的棍子在点 UUU 处断开,其中 UUU 是密度函数为 f(u)=1f(u) = 1f(u)=1 (0<u<10 < u < 10<u<1) 的随机变量,求包含点 ppp (0≤p≤10 \leq p \leq 10p1) 的那一截的长度的期望值。

Lp(U)L_p(U)Lp(U) 表示包含点 ppp 的那一截的长度:
Lp(U)={1−UU<pUU>p L_p(U) = \begin{cases} 1-U & U < p \\ U & U > p \end{cases} Lp(U)={1UUU<pU>p

利用命题 2.1:
E[Lp(U)]=∫01Lp(u) du=∫0p(1−u) du+∫p1u du=[u−u22]0p+[u22]p1=(p−p22)+(12−p22)=p−p2+12=12+p(1−p) \begin{aligned} E[L_p(U)] &= \int_{0}^{1} L_p(u) \, \mathrm{d}u \\ &= \int_{0}^{p} (1-u) \, \mathrm{d}u + \int_{p}^{1} u \, \mathrm{d}u \\ &= \left[ u - \frac{u^2}{2} \right]_{0}^{p} + \left[ \frac{u^2}{2} \right]_{p}^{1} \\ &= \left( p - \frac{p^2}{2} \right) + \left( \frac{1}{2} - \frac{p^2}{2} \right) \\ &= p - p^2 + \frac{1}{2} \\ &= \frac{1}{2} + p(1-p) \end{aligned} E[Lp(U)]=01Lp(u)du=0p(1u)du+p1udu=[u2u2]0p+[2u2]p1=(p2p2)+(212p2)=pp2+21=21+p(1p)

因为 p(1−p)p(1-p)p(1p)p=12p = \frac{1}{2}p=21 时取最大值,所以当 ppp 是棍子的中点时,包含点 ppp 的那一截的长度的期望取得最大值。


例 2d:假设你去赴约,如果早到 sss 分钟,那么需要花费 cscscs 元,如果晚到 sss 分钟,则需要花费 ksksks 元。又假设从你所在地点到约会地点所要花费的时间是一个概率密度函数为 fff 的随机变量,问如果要使得花费的期望值最小,你应该什么时候出发?

XXX 表示路途所花时间,如果在约会前 ttt 分钟出发,那么花费 Ct(X)C_t(X)Ct(X) 为:
Ct(X)={c(t−X)if X≤tk(X−t)if X≥t C_{t}(X) = \begin{cases} c(t - X) & \text{if } X \leq t \\ k(X - t) & \text{if } X \geq t \end{cases} Ct(X)={c(tX)k(Xt)if Xtif Xt

期望花费:
E[Ct(X)]=∫0∞Ct(x)f(x) dx=∫0tc(t−x)f(x) dx+∫t∞k(x−t)f(x) dx=ctF(t)−c∫0txf(x) dx+k∫t∞xf(x) dx−kt(1−F(t)) \begin{aligned} E[C_{t}(X)] &= \int_{0}^{\infty} C_{t}(x) f(x) \, \mathrm{d}x \\ &= \int_{0}^{t} c(t - x) f(x) \, \mathrm{d}x + \int_{t}^{\infty} k(x - t) f(x) \, \mathrm{d}x \\ &= ct F(t) - c \int_{0}^{t} x f(x) \, \mathrm{d}x + k \int_{t}^{\infty} x f(x) \, \mathrm{d}x - kt (1 - F(t)) \end{aligned} E[Ct(X)]=0Ct(x)f(x)dx=0tc(tx)f(x)dx+tk(xt)f(x)dx=ctF(t)c0txf(x)dx+ktxf(x)dxkt(1F(t))

ttt 求导:
ddtE[Ct(X)]=cF(t)+ctf(t)−ctf(t)−k(1−F(t))+ktf(t)−ktf(t)=cF(t)−k(1−F(t))=(c+k)F(t)−k \begin{aligned} \frac{d}{dt}E[C_t(X)] &= cF(t) + ct f(t) - ct f(t) - k(1 - F(t)) + kt f(t) - kt f(t) \\ &= cF(t) - k(1 - F(t)) \\ &= (c + k)F(t) - k \end{aligned} dtdE[Ct(X)]=cF(t)+ctf(t)ctf(t)k(1F(t))+ktf(t)ktf(t)=cF(t)k(1F(t))=(c+k)F(t)k

令导数等于 0:
(c+k)F(t∗)−k=0⇒F(t∗)=kk+c (c + k)F(t^*) - k = 0 \quad \Rightarrow \quad F(t^*) = \frac{k}{k + c} (c+k)F(t)k=0F(t)=k+ck

因此,在约会前 t∗t^*t 分钟出发使得花费的期望值最小,其中 t∗t^*t 满足 F(t∗)=kk+cF(t^*) = \frac{k}{k + c}F(t)=k+ck


期望的性质

推论 2.1:如果 aaabbb 都是常数,那么
E[aX+b]=aE[X]+b \boxed{E[aX + b] = aE[X] + b} E[aX+b]=aE[X]+b

证明
E[aX+b]=∫−∞∞(ax+b)f(x) dx=a∫−∞∞xf(x) dx+b∫−∞∞f(x) dx=aE[X]+b⋅1=aE[X]+b \begin{aligned} E[aX + b] &= \int_{-\infty}^{\infty} (ax + b) f(x) \, \mathrm{d}x \\ &= a \int_{-\infty}^{\infty} x f(x) \, \mathrm{d}x + b \int_{-\infty}^{\infty} f(x) \, \mathrm{d}x \\ &= aE[X] + b \cdot 1 \\ &= aE[X] + b \end{aligned} E[aX+b]=(ax+b)f(x)dx=axf(x)dx+bf(x)dx=aE[X]+b1=aE[X]+b


方差

对于连续型随机变量,方差的定义与离散型相同:

Var(X)=E[(X−μ)2]其中μ=E[X] Var(X) = E[(X - \mu)^2] \quad \text{其中} \quad \mu = E[X] Var(X)=E[(Xμ)2]其中μ=E[X]

另一种等价计算公式:
Var(X)=E[X2]−(E[X])2 \boxed{Var(X) = E[X^2] - (E[X])^2} Var(X)=E[X2](E[X])2

这个公式的证明与离散型情形一致:
Var(X)=E[(X−μ)2]=E[X2−2μX+μ2]=E[X2]−2μE[X]+μ2=E[X2]−2μ2+μ2=E[X2]−μ2 \begin{aligned} Var(X) &= E[(X - \mu)^2] \\ &= E[X^2 - 2\mu X + \mu^2] \\ &= E[X^2] - 2\mu E[X] + \mu^2 \\ &= E[X^2] - 2\mu^2 + \mu^2 \\ &= E[X^2] - \mu^2 \end{aligned} Var(X)=E[(Xμ)2]=E[X22μX+μ2]=E[X2]2μE[X]+μ2=E[X2]2μ2+μ2=E[X2]μ2

对常数 aaabbb,有:
Var(aX+b)=a2Var(X) Var(aX + b) = a^2 Var(X) Var(aX+b)=a2Var(X)

证明
Var(aX+b)=E[(aX+b−aμ−b)2]=E[a2(X−μ)2]=a2E[(X−μ)2]=a2Var(X) \begin{aligned} Var(aX + b) &= E[(aX + b - a\mu - b)^2] \\ &= E[a^2(X - \mu)^2] \\ &= a^2 E[(X - \mu)^2] \\ &= a^2 Var(X) \end{aligned} Var(aX+b)=E[(aX+baμb)2]=E[a2(Xμ)2]=a2E[(Xμ)2]=a2Var(X)


例题

例 2e:求例 2a 中随机变量 XXX 的方差 Var(X)Var(X)Var(X)

首先计算 E[X2]E[X^2]E[X2]
E[X2]=∫−∞∞x2f(x) dx=∫01x2⋅2x dx=∫012x3 dx=[12x4]01=12 \begin{aligned} E[X^2] &= \int_{-\infty}^{\infty} x^2 f(x) \, \mathrm{d}x \\ &= \int_{0}^{1} x^2 \cdot 2x \, \mathrm{d}x \\ &= \int_{0}^{1} 2x^3 \, \mathrm{d}x \\ &= \left[ \frac{1}{2} x^4 \right]_{0}^{1} \\ &= \frac{1}{2} \end{aligned} E[X2]=x2f(x)dx=01x22xdx=012x3dx=[21x4]01=21

已知 E[X]=23E[X] = \frac{2}{3}E[X]=32,所以:
Var(X)=E[X2]−(E[X])2=12−(23)2=12−49=118 \begin{aligned} Var(X) &= E[X^2] - (E[X])^2 \\ &= \frac{1}{2} - \left(\frac{2}{3}\right)^2 \\ &= \frac{1}{2} - \frac{4}{9} \\ &= \frac{1}{18} \end{aligned} Var(X)=E[X2](E[X])2=21(32)2=2194=181


本节小结

连续型随机变量的核心概念

  1. 定义:如果存在非负函数 fff 使得 P{X∈B}=∫Bf(x) dxP\{X \in B\} = \int_B f(x) \, \mathrm{d}xP{XB}=Bf(x)dx,则 XXX 为连续型随机变量

  2. 概率密度函数 (PDF)

    • f(x)≥0f(x) \geq 0f(x)0
    • ∫−∞∞f(x) dx=1\int_{-\infty}^{\infty} f(x) \, \mathrm{d}x = 1f(x)dx=1
    • P{a≤X≤b}=∫abf(x) dxP\{a \leq X \leq b\} = \int_a^b f(x) \, \mathrm{d}xP{aXb}=abf(x)dx
    • P{X=a}=0P\{X = a\} = 0P{X=a}=0 对任何 aaa
  3. 分布函数 (CDF)

    • F(a)=P{X≤a}=∫−∞af(x) dxF(a) = P\{X \leq a\} = \int_{-\infty}^a f(x) \, \mathrm{d}xF(a)=P{Xa}=af(x)dx
    • f(a)=ddaF(a)f(a) = \frac{d}{da} F(a)f(a)=dadF(a)
  4. 期望

    • E[X]=∫−∞∞xf(x) dxE[X] = \int_{-\infty}^{\infty} x f(x) \, \mathrm{d}xE[X]=xf(x)dx
    • E[g(X)]=∫−∞∞g(x)f(x) dxE[g(X)] = \int_{-\infty}^{\infty} g(x) f(x) \, \mathrm{d}xE[g(X)]=g(x)f(x)dx
    • E[aX+b]=aE[X]+bE[aX + b] = aE[X] + bE[aX+b]=aE[X]+b
  5. 方差

    • Var(X)=E[(X−E[X])2]=E[X2]−(E[X])2Var(X) = E[(X - E[X])^2] = E[X^2] - (E[X])^2Var(X)=E[(XE[X])2]=E[X2](E[X])2
    • Var(aX+b)=a2Var(X)Var(aX + b) = a^2 Var(X)Var(aX+b)=a2Var(X)

[!TIP]
连续型随机变量与离散型随机变量的主要区别在于:

  • 离散型:概率通过求和计算,单点概率可能非零
  • 连续型:概率通过积分计算,单点概率总是为零

但它们的期望和方差的定义和性质非常相似,只是将求和替换为积分。

http://www.lryc.cn/news/625746.html

相关文章:

  • Flask 路由与视图函数绑定机制
  • 编译器错误消息: CS0016: 未能写入输出文件“c:\Windows\Microsoft.NET... 拒绝访问
  • 概率论基础教程第4章 随机变量(四)
  • Android Cordova 开发 - Cordova 嵌入 Android
  • GaussDB 中 alter default privileges 的使用示例
  • 从H.264到AV1:音视频技术演进与模块化SDK架构全解析
  • Meta首款AR眼镜Hypernova呼之欲出,苹果/微美全息投入显著抢滩市场新增长点!
  • 搭建最新--若依分布式spring cloudv3.6.6 前后端分离项目--步骤与记录常见的坑
  • 磨砂玻璃登录页面使用教程 v0.1.1
  • 可靠性测试:软件稳定性的守护者
  • t12 low power design: power plan脚本分享(4) power stripe
  • 9.Ansible管理大项目
  • MCP(模型上下文协议):是否是 AI 基础设施中缺失的标准?
  • Flink原理与实践:第一章大数据技术概述总结
  • Ubuntu、CentOS、AlmaLinux 9.5的 rc.local实现 开机启动
  • 构建自主企业:AgenticOps 的技术蓝图
  • VS Code 终端完全指南
  • Java 大视界 -- Java 大数据机器学习模型在自然语言处理中的多语言翻译与文化适应性优化
  • Transformer十问
  • Java试题-选择题(11)
  • OpenHarmony 之多模态输入子系统源码深度架构解析
  • 记录一次问题,点击详情时设置Editor不可用,点击修改时也不可用了
  • Node.js 在 Windows Server 上的离线部署方案
  • 如何将任意文件一键转为PDF?
  • Markdown to PDF/PNG Converter
  • UniApp 微信小程序之间跳转指南
  • 专题:2025母婴行业消费洞察与分龄营养趋势报告|附40 +份报告PDF、交互图表数据汇总下载
  • 微信小程序实现蓝牙开启自动播放BGM
  • Java技术总监的成长之路(技术干货分享)
  • CAD图纸如何批量转换成PDF格式?