概率论基础教程第3章条件概率与独立性(一)
第3章 条件概率和独立性
3.1 条件概率
定义
我们从一个直观例子开始:同时掷两枚骰子,样本空间共36种等可能结果。若已知第一枚点数为3,则可能结果变为 (3,1) 到 (3,6) 共6种。此时两枚点数之和为8的概率是1/6,因为只有 (3,5) 满足条件。这一概率是在“第一枚为3”的条件下计算的,称为条件概率。
令 $ E $ 表示“点数之和为8”,$ F $ 表示“第一枚为3”。由于 $ F $ 发生后,样本空间缩小为 $ F $ 中的6个点,而 $ E $ 与 $ F $ 同时发生的结果只有 (3,5),即 $ EF $,因此条件概率应为 $ P(EF)/P(F) $。
由此引出定义:若 $ P(F) > 0 $,则
P(E∣F)=P(EF)P(F) P(E|F) = \frac{P(EF)}{P(F)} P(E∣F)=P(F)P(EF)
这是条件概率的数学定义。它表明,在 $ F $ 发生的前提下,$ E $ 发生的概率等于 $ EF $ 的概率除以 $ F $ 的概率。
由该定义可得乘法公式:
P(EF)=P(F)P(E∣F) P(EF) = P(F)P(E|F) P(EF)=P(F)P(E∣F)
此式在计算交事件概率时非常有用。它可以推广到多个事件的情形,称为乘法规则:
P(E1E2⋯En)=P(E1)P(E2∣E1)P(E3∣E1E2)⋯P(En∣E1⋯En−1) P(E_1E_2\cdots E_n) = P(E_1)P(E_2|E_1)P(E_3|E_1E_2)\cdots P(E_n|E_1\cdots E_{n-1}) P(E1E2⋯En)=P(E1)P(E2∣E1)P(E3∣E1E2)⋯P(En∣E1⋯En−1)
证明:将右边展开,
P(E1)⋅P(E1E2)P(E1)⋅P(E1E2E3)P(E1E2)⋯P(E1⋯En)P(E1⋯En−1)=P(E1E2⋯En) P(E_1) \cdot \frac{P(E_1E_2)}{P(E_1)} \cdot \frac{P(E_1E_2E_3)}{P(E_1E_2)} \cdots \frac{P(E_1\cdots E_n)}{P(E_1\cdots E_{n-1})} = P(E_1E_2\cdots E_n) P(E1)⋅P(E1)P(E1E2)⋅P(E1E2)P(E1E2E3)⋯P(E1⋯En−1)P(E1⋯En)=P(E1E2⋯En)
分子分母相消即得左边。
例题
例2a:乔伊80%确信钥匙在左或右口袋,左、右各40%。若检查左口袋未找到,则钥匙在右口袋的条件概率为:
令 $ L :钥匙在左口袋,:钥匙在左口袋,:钥匙在左口袋, R $:在右口袋,
P(R∣Lc)=P(RLc)P(Lc)=P(R)1−P(L)=0.40.6=23 P(R|L^c) = \frac{P(RL^c)}{P(L^c)} = \frac{P(R)}{1 - P(L)} = \frac{0.4}{0.6} = \frac{2}{3} P(R∣Lc)=P(Lc)P(RLc)=1−P(L)P(R)=0.60.4=32
例2b:抛硬币两次,样本空间 $ {(H,H),(H,T),(T,H),(T,T)} $ 等可能。
(a) 已知第一枚正面,求两枚都正面的概率:
令 $ B = {(H,H)} ,,, F = {(H,H),(H,T)} $,
P(B∣F)=P(BF)P(F)=1/42/4=12 P(B|F) = \frac{P(BF)}{P(F)} = \frac{1/4}{2/4} = \frac{1}{2} P(B∣F)=P(F)P(BF)=2/41/4=21
(b) 已知至少一枚正面,求两枚都正面的概率:
令 $ A = {(H,H),(H,T),(T,H)} $,
P(B∣A)=P(BA)P(A)=1/43/4=13 P(B|A) = \frac{P(BA)}{P(A)} = \frac{1/4}{3/4} = \frac{1}{3} P(B∣A)=P(A)P(BA)=3/41/4=31
例2c:桥牌中,52张牌均分四家。若南和北共有8张黑桃,则剩余26张牌中有5张黑桃,分给东西两家。求东有其中3张的条件概率:
(53)(2110)(2613)≈0.339
\frac{\binom{5}{3}\binom{21}{10}}{\binom{26}{13}} \approx 0.339
(1326)(35)(1021)≈0.339
例2d:席琳以掷硬币决定选课,选化学概率 $ 1/2 $。若选化学,获“A”概率 $ 2/3 $。求她选化学且获“A”的概率:
令 $ C :选化学,:选化学,:选化学, A $:获“A”,
P(CA)=P(C)P(A∣C)=12×23=13 P(CA) = P(C)P(A|C) = \frac{1}{2} \times \frac{2}{3} = \frac{1}{3} P(CA)=P(C)P(A∣C)=21×32=31
例2e:坛中有8红4白球,无放回取两球。
(a) 各球等可能被取:
令 $ R_1, R_2 $ 为第一次、第二次取红球,
P(R1)=812=23,P(R2∣R1)=711 P(R_1) = \frac{8}{12} = \frac{2}{3},\quad P(R_2|R_1) = \frac{7}{11} P(R1)=128=32,P(R2∣R1)=117
P(R1R2)=23×711=1433 P(R_1R_2) = \frac{2}{3} \times \frac{7}{11} = \frac{14}{33} P(R1R2)=32×117=3314
也可用组合法:$ \binom{8}{2}/\binom{12}{2} = 28/66 = 14/33 $
(b) 球质量不同,红球质量 $ r $,白球质量 $ w $,取球概率与其质量成正比:
P(R1)=8r8r+4w,P(R2∣R1)=7r7r+4w P(R_1) = \frac{8r}{8r + 4w},\quad P(R_2|R_1) = \frac{7r}{7r + 4w} P(R1)=8r+4w8r,P(R2∣R1)=7r+4w7r
P(R1R2)=8r8r+4w⋅7r7r+4w P(R_1R_2) = \frac{8r}{8r+4w} \cdot \frac{7r}{7r+4w} P(R1R2)=8r+4w8r⋅7r+4w7r
[!NOTE]
关于无人配对概率的计算可查看第二章例5m 使用了容斥恒等式和泰勒展开
例2f:配对问题中,$ N $ 人随机取帽,无人配对的概率为 $ P_N = \sum_{i=0}^N (-1)^i / i! $。求恰好 $ k $ 人配对成功的概率。
令 $ E $:某 $ k $ 人全配对成功,$ G $:其余 $ N-k $ 人无一人配对。
P(EG)=P(E)P(G∣E) P(EG) = P(E)P(G|E) P(EG)=P(E)P(G∣E)
令 $ F_i $:第 $ i $ 人配对成功,
P(E)=P(F1⋯Fk)=1N⋅1N−1⋯1N−k+1=(N−k)!N! P(E) = P(F_1\cdots F_k) = \frac{1}{N} \cdot \frac{1}{N-1} \cdots \frac{1}{N-k+1} = \frac{(N-k)!}{N!} P(E)=P(F1⋯Fk)=N1⋅N−11⋯N−k+11=N!(N−k)!
已知这 $ k $ 人配对成功后,剩下 $ N-k $ 人从 $ N-k $ 顶帽子中随机取,无人配对的概率为 $ P_{N-k} $,故
P(G∣E)=PN−k=∑i=0N−k(−1)ii! P(G|E) = P_{N-k} = \sum_{i=0}^{N-k} \frac{(-1)^i}{i!} P(G∣E)=PN−k=i=0∑N−ki!(−1)i
所以
P(EG)=(N−k)!N!PN−k P(EG) = \frac{(N-k)!}{N!} P_{N-k} P(EG)=N!(N−k)!PN−k
由于任选 $ k $ 人都适用,且共有 $ \binom{N}{k} $ 种选法,故恰好 $ k $ 人配对成功的概率为
(Nk)⋅(N−k)!N!PN−k=PN−kk! \binom{N}{k} \cdot \frac{(N-k)!}{N!} P_{N-k} = \frac{P_{N-k}}{k!} (kN)⋅N!(N−k)!PN−k=k!PN−k
当 $ N $ 很大时,$ P_{N-k} \approx e^{-1} $,故该概率约等于 $ e^{-1}/k! $
例2g:52张牌随机分4堆,每堆13张。求每堆恰有一张A的概率。
定义事件:
- $ E_1 :黑桃A在某一堆(必然发生,:黑桃A在某一堆(必然发生,:黑桃A在某一堆(必然发生, P(E_1)=1 $)
- $ E_2 $:红桃A不在黑桃A那堆
- $ E_3 $:方块A不在前两张A所在的堆
- $ E_4 $:梅花A不在前三张A所在的堆
所求概率为 $ P(E_1E_2E_3E_4) = P(E_1)P(E_2|E_1)P(E_3|E_1E_2)P(E_4|E_1E_2E_3) $
- $ P(E_1) = 1 $
- $ P(E_2|E_1) = 1 - \frac{12}{51} = \frac{39}{51} $(红桃A有51个位置可选,12个与黑桃A同堆)
- $ P(E_3|E_1E_2) = 1 - \frac{24}{50} = \frac{26}{50} $(前两堆共26张,已用2张A,剩24张非A,方块A避开这24张)
- $ P(E_4|E_1E_2E_3) = 1 - \frac{36}{49} = \frac{13}{49} $(前三堆共39张,已用3张A,剩36张非A)
故
P=1⋅3951⋅2650⋅1349=39×26×1351×50×49≈0.105 P = 1 \cdot \frac{39}{51} \cdot \frac{26}{50} \cdot \frac{13}{49} = \frac{39 \times 26 \times 13}{51 \times 50 \times 49} \approx 0.105 P=1⋅5139⋅5026⋅4913=51×50×4939×26×13≈0.105
3.2 贝叶斯公式与全概率公式
定义
接下来讨论如何利用另一个事件的发生与否来计算某事件的概率。设 $ E $ 和 $ F $ 为两事件,则
E=EF∪EFc
E = EF \cup EF^c
E=EF∪EFc
且 $ EF $ 与 $ EF^c $ 互不相容,故
P(E)=P(EF)+P(EFc)=P(E∣F)P(F)+P(E∣Fc)P(Fc) P(E) = P(EF) + P(EF^c) = P(E|F)P(F) + P(E|F^c)P(F^c) P(E)=P(EF)+P(EFc)=P(E∣F)P(F)+P(E∣Fc)P(Fc)
此即全概率公式的一种形式,适用于将事件 $ E $ 按另一事件 $ F $ 是否发生进行分解。
例3a:保险公司将人分为易出事故者(占30%,年事故概率0.4)和不易者(70%,年事故概率0.2)。求一新人一年内出事故的概率:
P(A1)=0.4×0.3+0.2×0.7=0.26
P(A_1) = 0.4 \times 0.3 + 0.2 \times 0.7 = 0.26
P(A1)=0.4×0.3+0.2×0.7=0.26
若该人出事故,求其为易出事故者的概率:
P(A∣A1)=P(A1∣A)P(A)P(A1)=0.4×0.30.26=613 P(A|A_1) = \frac{P(A_1|A)P(A)}{P(A_1)} = \frac{0.4 \times 0.3}{0.26} = \frac{6}{13} P(A∣A1)=P(A1)P(A1∣A)P(A)=0.260.4×0.3=136
此即贝叶斯公式的应用。
一般地,若 $ F_1,\dots,F_n $ 互不相容且并为全样本空间,则对任意事件 $ E $,
P(E)=∑i=1nP(E∣Fi)P(Fi) P(E) = \sum_{i=1}^n P(E|F_i)P(F_i) P(E)=i=1∑nP(E∣Fi)P(Fi)
此为全概率公式。
若 $ E $ 发生,求某一 $ F_j $ 发生的概率,由条件概率定义和全概率公式得:
P(Fj∣E)=P(EFj)P(E)=P(E∣Fj)P(Fj)∑i=1nP(E∣Fi)P(Fi) P(F_j|E) = \frac{P(EF_j)}{P(E)} = \frac{P(E|F_j)P(F_j)}{\sum_{i=1}^n P(E|F_i)P(F_i)} P(Fj∣E)=P(E)P(EFj)=∑i=1nP(E∣Fi)P(Fi)P(E∣Fj)P(Fj)
此即贝叶斯公式。
例题
例3b:扑克游戏中,52张牌面朝下,玩家可猜下一张是否为黑桃A,或等至最后一张。证明任意策略获胜概率均为 1/n1/n1/n(对 nnn 张牌)。
用归纳法:对 n=1n=1n=1 成立。假设对 n−1n-1n−1 成立。设策略第一次猜的概率为 ppp。
-
第一次猜中概率:p×1np \times \frac{1}{n}p×n1
- 解释:黑桃A出现在任意位置的概率为 1/n1/n1/n,玩家在第一张前猜测的概率为 ppp,故联合概率为 p/np/np/n
-
第一次不猜且获胜:
-
(1−p)(1-p)(1−p):不在第一张前猜测的概率
-
n−1n\frac{n-1}{n}nn−1:第一张不是黑桃A的概率
-
在第一张不是黑桃A的条件下,剩余 n−1n-1n−1 张牌构成子问题,根据归纳假设,使用该策略在子问题中获胜的概率为 1n−1\frac{1}{n-1}n−11
-
因此,该路径获胜概率为:
(1−p)⋅n−1n⋅1n−1=(1−p)⋅1n (1-p) \cdot \frac{n-1}{n} \cdot \frac{1}{n-1} = (1-p) \cdot \frac{1}{n} (1−p)⋅nn−1⋅n−11=(1−p)⋅n1
-
总概率:pn+1−pn=1n\frac{p}{n} + \frac{1-p}{n} = \frac{1}{n}np+n1−p=n1
例3c:学生以概率 $ p $ 知道答案,否则猜($ m $ 个选项,猜中概率 $ 1/m $)。已知答对,求其知道答案的概率:
-
事件定义:
- KKK:学生知道答案的事件
- CCC:学生答对题的事件
-
计算过程:
P(K∣C)=P(C∣K)P(K)P(C∣K)P(K)+P(C∣Kc)P(Kc)=pp+(1/m)(1−p)=mp1+(m−1)p P(K|C) = \frac{P(C|K)P(K)}{P(C|K)P(K) + P(C|K^c)P(K^c)} = \frac{p}{p + (1/m)(1-p)} = \frac{mp}{1 + (m-1)p} P(K∣C)=P(C∣K)P(K)+P(C∣Kc)P(Kc)P(C∣K)P(K)=p+(1/m)(1−p)p=1+(m−1)pmp -
解释:
- P(K)=pP(K) = pP(K)=p:学生知道答案的先验概率
- P(Kc)=1−pP(K^c) = 1-pP(Kc)=1−p:学生不知道答案的概率
- P(C∣K)=1P(C|K) = 1P(C∣K)=1:如果学生知道答案,则一定答对
- P(C∣Kc)=1/mP(C|K^c) = 1/mP(C∣Kc)=1/m:如果学生不知道答案而猜测,则答对的概率为 1/m1/m1/m
-
具体数值:
若 $ m=5, p=1/2 $,则 $ P(K|C) = \frac{5 \times 0.5}{1 + 4 \times 0.5} = \frac{2.5}{3} = \frac{5}{6} $
例3d:疾病检测:患病率0.5%,检测灵敏度95%,伪阳性率1%。若检测阳性,求实际患病概率:
-
事件定义:
- DDD:个体患病的事件
- EEE:检测结果为阳性的事件
-
计算过程:
P(D∣E)=P(E∣D)P(D)P(E∣D)P(D)+P(E∣Dc)P(Dc)=0.95×0.0050.95×0.005+0.01×0.995=0.004750.0147=95294≈0.323 P(D|E) = \frac{P(E|D)P(D)}{P(E|D)P(D) + P(E|D^c)P(D^c)} = \frac{0.95 \times 0.005}{0.95 \times 0.005 + 0.01 \times 0.995} = \frac{0.00475}{0.0147} = \frac{95}{294} \approx 0.323 P(D∣E)=P(E∣D)P(D)+P(E∣Dc)P(Dc)P(E∣D)P(D)=0.95×0.005+0.01×0.9950.95×0.005=0.01470.00475=29495≈0.323 -
解释:
- P(D)=0.005P(D) = 0.005P(D)=0.005:患病的先验概率(患病率)
- P(Dc)=0.995P(D^c) = 0.995P(Dc)=0.995:未患病的概率
- P(E∣D)=0.95P(E|D) = 0.95P(E∣D)=0.95:灵敏度(患病时检测为阳性的概率)
- P(E∣Dc)=0.01P(E|D^c) = 0.01P(E∣Dc)=0.01:伪阳性率(未患病时检测为阳性的概率)
例3e:药剂师初始认为琼斯患病概率60%。检查A对患者必阳性,对健康人本不阳性,但若患者患糖尿病且无此病,则有30%概率阳性。现琼斯检查A阳性且患糖尿病,求其患病概率:
-
事件定义:
- DDD:琼斯患病的事件
- EEE:检查A结果为阳性的事件
-
计算过程:
P(D∣E)=P(E∣D)P(D)P(E∣D)P(D)+P(E∣Dc)P(Dc)=1×0.61×0.6+0.3×0.4=0.60.72≈0.833 P(D|E) = \frac{P(E|D)P(D)}{P(E|D)P(D) + P(E|D^c)P(D^c)} = \frac{1 \times 0.6}{1 \times 0.6 + 0.3 \times 0.4} = \frac{0.6}{0.72} \approx 0.833 P(D∣E)=P(E∣D)P(D)+P(E∣Dc)P(Dc)P(E∣D)P(D)=1×0.6+0.3×0.41×0.6=0.720.6≈0.833 -
解释:
- P(D)=0.6P(D) = 0.6P(D)=0.6:初始认为琼斯患病的概率
- P(Dc)=0.4P(D^c) = 0.4P(Dc)=0.4:初始认为琼斯不患病的概率
- P(E∣D)=1P(E|D) = 1P(E∣D)=1:如果琼斯患病,则检查A一定为阳性
- P(E∣Dc)=0.3P(E|D^c) = 0.3P(E∣Dc)=0.3:如果琼斯不患病但患糖尿病,则检查A为阳性的概率
-
结论:超过80%,故应建议手术。
例3f:调查员60%确信嫌疑人犯罪。罪犯有某特征(20%人口具有)。若嫌疑人具有该特征,求其犯罪概率:
-
事件定义:
- GGG:嫌疑人犯罪的事件
- CCC:嫌疑人具有特定特征的事件
-
计算过程:
P(G∣C)=P(C∣G)P(G)P(C∣G)P(G)+P(C∣Gc)P(Gc)=1×0.61×0.6+0.2×0.4=0.60.68≈0.882 P(G|C) = \frac{P(C|G)P(G)}{P(C|G)P(G) + P(C|G^c)P(G^c)} = \frac{1 \times 0.6}{1 \times 0.6 + 0.2 \times 0.4} = \frac{0.6}{0.68} \approx 0.882 P(G∣C)=P(C∣G)P(G)+P(C∣Gc)P(Gc)P(C∣G)P(G)=1×0.6+0.2×0.41×0.6=0.680.6≈0.882 -
解释:
- P(G)=0.6P(G) = 0.6P(G)=0.6:调查员初始认为嫌疑人犯罪的概率
- P(Gc)=0.4P(G^c) = 0.4P(Gc)=0.4:调查员初始认为嫌疑人不犯罪的概率
- P(C∣G)=1P(C|G) = 1P(C∣G)=1:如果嫌疑人犯罪,则一定具有该特征
- P(C∣Gc)=0.2P(C|G^c) = 0.2P(C∣Gc)=0.2:一般人群中具有该特征的比例
例3g:Reese 和 Schapiro 被控桥牌作弊。控方称其打法与作弊假设一致,故支持作弊。作者指出:新证据支持假设当且仅当 $ P(E|H) > P(E|H^c) $,即证据在假设成立时更可能发生。控方仅说明 $ P(E|H) $ 较高,但未比较 $ P(E|H^c) $,故其论证无效。
-
事件定义:
- HHH:作弊假设成立的事件
- HcH^cHc:作弊假设不成立的事件
- EEE:观察到的证据(特定的打牌方式)
-
解释:要确定证据E是否支持假设H,需要比较P(E∣H)P(E|H)P(E∣H)和P(E∣Hc)P(E|H^c)P(E∣Hc)。只有当P(E∣H)>P(E∣Hc)P(E|H) > P(E|H^c)P(E∣H)>P(E∣Hc)时,证据E才支持假设H。控方只证明了P(E∣H)P(E|H)P(E∣H)较高,但没有与P(E∣Hc)P(E|H^c)P(E∣Hc)比较,因此无法确定证据是否支持作弊假设。
例3h:统计学家知64%双胞胎性别相同。同卵双生必同性别,异卵双生性别相同概率为 $ 1/2 $。求同卵双生比例。
-
事件定义:
- III:双胞胎为同卵双生的事件
- SSSSSS:双胞胎性别相同的事件
-
计算过程:
P(SS)=P(SS∣I)P(I)+P(SS∣Ic)P(Ic)=1⋅P(I)+12(1−P(I))=12+12P(I) P(SS) = P(SS|I)P(I) + P(SS|I^c)P(I^c) = 1 \cdot P(I) + \frac{1}{2}(1 - P(I)) = \frac{1}{2} + \frac{1}{2}P(I) P(SS)=P(SS∣I)P(I)+P(SS∣Ic)P(Ic)=1⋅P(I)+21(1−P(I))=21+21P(I) -
解释:
- P(SS∣I)=1P(SS|I) = 1P(SS∣I)=1:同卵双生必然性别相同
- P(SS∣Ic)=1/2P(SS|I^c) = 1/2P(SS∣Ic)=1/2:异卵双生性别相同的概率
- P(SS)=0.64P(SS) = 0.64P(SS)=0.64:实际观察到的性别相同比例
-
求解:
代入 $ P(SS) = 0.64 $,得 $ 0.64 = 0.5 + 0.5P(I) \Rightarrow P(I) = 0.28 $
例3i:坛中有2枚A型硬币(正面概率 $ 1/4 $)和1枚B型(正面概率 $ 3/4 $)。随机取一枚掷出正面,求其为A型的概率。
-
事件定义:
- AAA:取到A型硬币
- HHH:掷出正面
-
计算过程:
P(A∣H)P(Ac∣H)=P(H∣A)P(A)P(H∣Ac)P(Ac)=(1/4)(2/3)(3/4)(1/3)=1/61/4=23 \frac{P(A|H)}{P(A^c|H)} = \frac{P(H|A)P(A)}{P(H|A^c)P(A^c)} = \frac{(1/4)(2/3)}{(3/4)(1/3)} = \frac{1/6}{1/4} = \frac{2}{3} P(Ac∣H)P(A∣H)=P(H∣Ac)P(Ac)P(H∣A)P(A)=(3/4)(1/3)(1/4)(2/3)=1/41/6=32
所以 $ P(A|H) : P(A^c|H) = 2:3 $,故
P(A∣H)=22+3=25 P(A|H) = \frac{2}{2+3} = \frac{2}{5} P(A∣H)=2+32=52
例3j:3张卡片:两面红、两面黑、一红一黑。随机取一张,朝上一面为红,求另一面为黑的概率。
-
事件定义:
- RRRRRR:取到两面红的卡片的事件
- BBBBBB:取到两面黑的卡片的事件
- RBRBRB:取到一红一黑的卡片的事件
- RRR:朝上一面为红色的事件
-
计算过程:
P(RB∣R)=P(R∣RB)P(RB)P(R∣RR)P(RR)+P(R∣RB)P(RB)+P(R∣BB)P(BB)=12⋅131⋅13+12⋅13+0=1/61/2=13 P(RB|R) = \frac{P(R|RB)P(RB)}{P(R|RR)P(RR) + P(R|RB)P(RB) + P(R|BB)P(BB)} = \frac{\frac{1}{2} \cdot \frac{1}{3}}{1 \cdot \frac{1}{3} + \frac{1}{2} \cdot \frac{1}{3} + 0} = \frac{1/6}{1/2} = \frac{1}{3} P(RB∣R)=P(R∣RR)P(RR)+P(R∣RB)P(RB)+P(R∣BB)P(BB)P(R∣RB)P(RB)=1⋅31+21⋅31+021⋅31=1/21/6=31 -
解释:
- 三张卡片共6个面等可能
- 红面有3个(RRRRRR 的两个 + RBRBRB 的一个)
- 其中仅1个背面为黑
- 故答案为 $ 1/3 $
例3k:夫妇有两个孩子,某天见母亲带一女孩散步,求两孩皆为女孩的概率。
-
事件定义:
- G1G_1G1:老大为女孩的事件
- G2G_2G2:老二为女孩的事件
- GGG:看到的是女孩的事件
-
计算过程:
P(G1G2∣G)=P(G1G2)P(G) P(G_1G_2|G) = \frac{P(G_1G_2)}{P(G)} P(G1G2∣G)=P(G)P(G1G2)P(G)=P(G∣G1G2)P(G1G2)+P(G∣G1B2)P(G1B2)+P(G∣B1G2)P(B1G2)+P(G∣B1B2)P(B1B2) P(G) = P(G|G_1G_2)P(G_1G_2) + P(G|G_1B_2)P(G_1B_2) + P(G|B_1G_2)P(B_1G_2) + P(G|B_1B_2)P(B_1B_2) P(G)=P(G∣G1G2)P(G1G2)+P(G∣G1B2)P(G1B2)+P(G∣B1G2)P(B1G2)+P(G∣B1B2)P(B1B2)
-
解释:
- 假设四种性别组合等可能(各 $ 1/4 $)
- 若母亲无偏好,带老大概率为 $ p $,则:
- P(G∣G1B2)=pP(G|G_1B_2)=pP(G∣G1B2)=p:老大是女孩,老二是男孩时看到女孩的概率
- P(G∣B1G2)=1−pP(G|B_1G_2)=1-pP(G∣B1G2)=1−p:老大是男孩,老二是女孩时看到女孩的概率
-
结果:
P(G1G2∣G)=1/41/4+p/4+(1−p)/4=12 P(G_1G_2|G) = \frac{1/4}{1/4 + p/4 + (1-p)/4} = \frac{1}{2} P(G1G2∣G)=1/4+p/4+(1−p)/41/4=21- 若母亲总是带女孩,则 $ P(G_1G_2|G) = \frac{1}{3} $
- 故答案依赖于母亲选择带哪个孩子散步的机制,问题本身信息不足。
例3l:手电类型:第一种占20%,寿命>100小时概率0.7;第二种30%,概率0.4;第三种50%,概率0.3。
-
事件定义:
- AAA:手电寿命>100小时的事件
- FjF_jFj:手电为第 jjj 种类型的事件
-
计算过程:
(a) 随机取一手电,寿命>100小时的概率:
P(A)=0.7×0.2+0.4×0.3+0.3×0.5=0.14+0.12+0.15=0.41 P(A) = 0.7 \times 0.2 + 0.4 \times 0.3 + 0.3 \times 0.5 = 0.14 + 0.12 + 0.15 = 0.41 P(A)=0.7×0.2+0.4×0.3+0.3×0.5=0.14+0.12+0.15=0.41(b) 已知寿命>100小时,求其为第 $ j $ 种的条件概率:
P(Fj∣A)=P(A∣Fj)P(Fj)0.41 P(F_j|A) = \frac{P(A|F_j)P(F_j)}{0.41} P(Fj∣A)=0.41P(A∣Fj)P(Fj) -
结果:
- $ P(F_1|A) = 0.14 / 0.41 = 14/41 $
- $ P(F_2|A) = 0.12 / 0.41 = 12/41 $
- $ P(F_3|A) = 0.15 / 0.41 = 15/41 $
例3m:DNA匹配问题。城镇100万人,10000人有前科,DNA匹配概率 $ 10^{-5} $。律师认为有前科者作案概率为无前科者的 $ c $ 倍。
-
事件定义:
- GGG:AJ Jones为作案者的事件
- MMM:AJ Jones是唯一DNA匹配者的事件
-
计算过程:
设 $ \alpha :有前科者作案概率,:有前科者作案概率,:有前科者作案概率, \beta :无前科者作案概率,:无前科者作案概率,:无前科者作案概率, \alpha = c\beta $由 $ 10000\alpha + 990000\beta = 1 $,得
β=110000c+990000,α=c10000c+990000 \beta = \frac{1}{10000c + 990000},\quad \alpha = \frac{c}{10000c + 990000} β=10000c+9900001,α=10000c+990000cP(M∣G)=(1−10−5)9999 P(M|G) = (1 - 10^{-5})^{9999} P(M∣G)=(1−10−5)9999
P(M∣Gc)=10−5⋅1−10000α1−α⋅(1−10−5)9999 P(M|G^c) = 10^{-5} \cdot \frac{1 - 10000\alpha}{1 - \alpha} \cdot (1 - 10^{-5})^{9999} P(M∣Gc)=10−5⋅1−α1−10000α⋅(1−10−5)9999
P(G∣M)=αP(M∣G)αP(M∣G)+(1−α)P(M∣Gc)=αα+10−5(1−10000α) P(G|M) = \frac{\alpha P(M|G)}{\alpha P(M|G) + (1 - \alpha) P(M|G^c)} = \frac{\alpha}{\alpha + 10^{-5}(1 - 10000\alpha)} P(G∣M)=αP(M∣G)+(1−α)P(M∣Gc)αP(M∣G)=α+10−5(1−10000α)α
-
结果:
- 若 $ c=100 $,则 $ \alpha = 1/19900 ,,, P(G|M) \approx 0.9099 $
- 若 $ c=10 $,则 $ \alpha = 1/109000 ,,, P(G|M) \approx 0.5025 $
- 若 $ c=1 $,则 $ \alpha = 10^{-6} ,,, P(G|M) \approx 0.0917 $