在研究具体的随机现象时我们通常着重关注以下要素:
- 样本空间 Ω,指明随机现象所有可能出现的结果。
- 事件域 F,表示我们所关心的所有事件。
- 概率 P,描述每一个事件发生的可能性大小。
样本空间、随机事件
一个随机现象中可能发生的不能再细分的结果被称为 样本点。所有样本点的集合称为 样本空间,通常用 Ω 来表示。
一个 随机事件 是样本空间 Ω 的子集,它由若干样本点构成,用大写字母 A,B,C,⋯ 表示。
对于一个随机现象的结果 ω 和一个随机事件 A,我们称事件 A 发生了 当且仅当 ω∈A。
例如,掷一次骰子得到的点数是一个随机现象,其样本空间可以表示为 Ω={1,2,3,4,5,6}。设随机事件 A 为「获得的点数大于 4」,则 A={5,6}。若某次掷骰子得到的点数 ω=3,由于 ω∈/A,故事件 A 没有发生。
事件的运算
由于我们将随机事件定义为了样本空间 Ω 的子集,故我们可以将集合的运算(如交、并、补等)移植到随机事件上。记号与集合运算保持一致。
特别的,事件的并 A∪B 也可记作 A+B,事件的交 A∩B 也可记作 AB,此时也可分别称作 和事件 和 积事件。
事件域
研究具体的随机现象时我们需要明确哪些事件是我们感兴趣的。根据随机事件的定义,显然有 F⊂2Ω(记号 2Ω 表示由 Ω 的所有子集组成的集合族),但 F=2Ω 却不是必须的。这在样本空间 Ω 有限时可能有些难以理解,毕竟 2Ω 尽管更大了但仍然有限。而当 Ω 为无穷集时,2Ω 的势变得更大,其中也难免会出现一些「性质不太好」且我们不关心的事件,这时为了兼顾这些事件而放弃一些性质就显得得不偿失了。
尽管 F=2Ω 不是必须的,这并不代表 2Ω 的任一子集都能成为事件域。我们通常会对一些事件进行运算得到的结果事件的概率感兴趣,因此我们希望事件域 F 满足下列条件:
- ∅∈F;
- 若 A∈F,则补事件 Aˉ∈F;
- 若有一列事件 An∈F,n=1,2,3…,则 ⋃An∈F。
简言之,就是事件域 F 对在补运算、和可数并下是封闭的,且包含元素 ∅。
可以证明满足上述三个条件的事件域 F 对可数交也是封闭的。
以掷骰子为例,当样本空间记为 Ω={1,2,3,4,5,6} 时,以下两个集合能够成为事件域:
- F1={∅,Ω}
- F2={∅,{1,3,5},{2,4,6},Ω}
但以下两个集合则不能
- F3={∅,{1},Ω}(对补不封闭)
- F4={{1,3,5},{2,4,6}}(不含有 ∅ 且对并不封闭)
古典定义
在概率论早期实践中,由于涉及到的随机现象都比较简单,具体表现为样本空间 Ω 是有限集,且直观上所有样本点是等可能出现的,因此人们便总结出了下述定义:
如果一个随机现象满足:
- 只有有限个基本结果;
- 每个基本结果出现的可能性是一样的;
那么对于每个事件 A,定义它的概率为
P(A)=#(Ω)#(A)
其中 #(⋅) 表示对随机事件(一个集合)大小的度量。
后来人们发现这一定义可以直接推广到 Ω 无限的一部分情景中,于是就有了所谓 几何概型。
公理化定义
上述基于直观认识的定义在逻辑上有一个很大的漏洞:在定义「概率」这一概念时用到了「可能性」这一说法,产生了循环定义的问题。同时「等可能」在样本空间无限时会产生歧义,由此产生了包括 Bertrand 悖论 在内的一系列问题。
经过不断探索,苏联数学家柯尔莫哥洛夫于 1933 年在他的《概率论基础》一书中第一次给出了概率的公理化定义:
概率函数 P 是一个从事件域 F 到闭区间 [0,1] 的映射,且满足:
- 规范性:事件 Ω 的概率值为 1,即 P(Ω)=1。
- 可数可加性:若一列事件 A1,A2,⋯ 两两不交,则 P(⋃i≥1Ai)=∑i≥1P(Ai)。
概率函数的性质
对于任意随机事件 A,B∈F,有
- 单调性:若 A⊂B,则有 P(A)≤P(B)。
- 容斥原理:P(A+B)=P(A)+P(B)−P(AB)。
- P(A−B)=P(A)−P(AB),这里 A−B 表示差集。
概率空间
我们在一开始提到,研究具体的随机现象时我们通常关注样本空间 Ω、事件域 F 以及概率函数 P。我们将三元组 (Ω,F,P) 称为一个概率空间。
概率只有在确定的概率空间下讨论才有意义。我们前面提到的 Bertrand 悖论归根结底就是因对样本空间 Ω 的定义不明确而产生的。
参考资料与注释