跳到主要内容

条件概率与独立性

概述

当某事件已经发生时,一些随机事件的概率会因为已知信息的增加发生变化。例如在手游抽卡时,我们可能会认为单次抽卡出六星与不出六星是等概率的,但随着我们连抽 5050 发一个六星都没有,再固执地认为「出六星与不出六星等概率」就显得不是那么明智。

总之,研究在某些已知条件下事件发生的概率是必要的。

条件概率

定义

若已知事件 AA 发生,在此条件下事件 BB 发生的概率称为 条件概率,记作 P(BA)P(B|A)

在概率空间 (Ω,F,P)(\Omega, \mathcal{F}, P) 中,若事件 AFA \in \mathcal{F} 满足 P(A)>0P(A) > 0,则条件概率 P(A)P(\cdot|A) 定义为

P(BA)=P(AB)P(A)BFP(B|A) = \frac{P(AB)}{P(A)} \quad \forall B \in \mathcal{F}

可以验证根据上式定义出的 P(A)P(\cdot|A)(Ω,F)(\Omega, \mathcal{F}) 上的概率函数。

根据条件概率的定义可以直接推出下面两个等式:

  • 概率乘法公式:在概率空间 (Ω,F,P)(\Omega, \mathcal{F}, P) 中,若 P(A)>0P(A) > 0,则对任意事件 BB 都有
P(AB)=P(A)P(BA)P(AB) = P(A)P(B|A)
  • 全概率公式:在概率空间 (Ω,F,P)(\Omega, \mathcal{F}, P) 中,若一组事件 A1,,AnA_1, \cdots, A_n 两两不交且和为 Ω\Omega,则对任意事件 BB 都有
P(B)=i=1nP(Ai)P(BAi)P(B) = \sum_{i=1}^{n} P(A_i)P(B|A_i)

Bayes 公式

一般来说,设可能导致事件 BB 发生的原因为 A1,A2,,AnA_1, A_2, \cdots, A_n,则在 P(Ai)P(A_i)P(BAi)P(B|A_i) 已知时可以通过全概率公式计算事件 BB 发生的概率。但在很多情况下,我们需要根据「事件 BB 发生」这一结果反推其各个原因事件的发生概率。于是有

P(AiB)=P(AiB)P(B)=P(Ai)P(BAi)j=1nP(Aj)P(BAj)P(A_i|B) = \frac{P(A_iB)}{P(B)} = \frac{P(A_i)P(B|A_i)}{\sum_{j=1}^{n} P(A_j)P(B|A_j)}

上式即 Bayes 公式。

事件的独立性

在研究条件概率的过程中,可能会出现 P(BA)=P(B)P(B|A) = P(B) 的情况。从直观上讲就是事件 BB 是否发生并不会告诉我们关于事件 AA 的任何信息,即事件 BB 与事件 AA「无关」。于是我们就有了下面的定义

定义

若同一概率空间中的事件 AA,BB 满足

P(AB)=P(A)P(B)P(AB) = P(A)P(B)

则称 AA,BB 独立。对于多个事件 A1,A2,,AnA_1, A_2, \cdots, A_n,我们称其独立,当且仅当对任意一组事件 {Aik:1i1<i2<<ikn}\{ A_{i_k} : 1 \leq i_1 < i_2 < \cdots < i_k \leq n \} 都有

P(Ai1Ai2Air)=k=1rP(Aik)P( A_{i_1}A_{i_2} \cdots A_{i_r} ) = \prod_{k=1}^{r} P(A_{i_k})

多个事件的独立性

对于多个事件,一般不能从两两独立推出这些事件独立。考虑以下反例:

有一个正四面体骰子,其中三面被分别涂成红色、绿色、蓝色,另一面则三色皆有。现在扔一次该骰子,令事件 AA,BB,CC 分别表示与桌面接触的一面包含红色、绿色、蓝色。

不难计算 P(A)=P(B)=P(C)=12P(A) = P(B) = P(C) = \frac{1}{2},而 P(AB)=P(BC)=P(CA)=P(ABC)=14P(AB) = P(BC) = P(CA) = P(ABC) = \frac{1}{4}

显然 A,B,CA, B, C 两两独立,但由于 P(ABC)P(A)P(B)P(C)P(ABC) \neq P(A)P(B)P(C),故 A,B,CA, B, C 不独立。