相关概念
随机变量
给定概率空间 (Ω,F,P),定义在样本空间 Ω 上的函数 X:Ω→R 若满足:对任意 t∈R 都有
{ω∈Ω:X(ω)≤t}∈F
则称 X 为 随机变量。
示性函数
对于样本空间 Ω 上的事件 A,定义随机变量
IA(ω)={1,0,ω∈Aω∈/A
称 IA 是事件 A 的 示性函数。
分布函数
对于随机变量 X,称函数
F(x)=P(X≤x)
为随机变量 X 的 分布函数。记作 X∼F(x)。
分布函数具有以下性质:
- 右连续性:F(x)=F(x+0)
- 单调性:在 R 上单调递增(非严格)
- F(−∞)=0,F(+∞)=1
同时我们可以证明,满足上述要求的函数都是某个随机变量的分布函数。因此,分布函数与随机变量之间一一对应。
随机变量的分类
随机变量按其值域(根据定义,随机变量是一个函数)是否可数分为 离散型 和 连续型 两种。
离散型随机变量
设 X 为离散型随机变量,其所有可能的取值为 x1,x2,⋯,则我们可以用一系列形如 P{X=xi}=pi 的等式来描述 X。这就是我们在高中课本中学过的 分布列。
连续型随机变量
设 X 为连续型随机变量,考察 P{X=x} 往往是无意义的(因为这一概率很可能是 0)。
考虑这样的随机变量 X:它以 21 的概率取 0,以 21 的概率服从开区间 (0,1) 上的均匀分布。显然 X 满足连续型随机变量的定义。
对任何实数 r∈(0,1),不难得到 P{X=r}=0,但同时有 P{X=0}=21。
另一方面,设 X∼F(x),则
P(l<x≤l+Δx)=F(l+Δx)−F(l)
一个自然的想法是用极限 Δx→0+limΔxF(l+Δx)−F(l) 来描述 X 取值为 l 的可能性。
这个式子就是我们熟知的导数,于是问题转化为寻找一个非负函数 f(x) 使得
F(x)=∫−∞xf(x)dx
若这样的 f(x) 存在,则称之为 X 的 密度函数。
随机变量的独立性
前面讨论了随机事件的独立性。由于随机变量和随机事件紧密联系,我们还可以类似地给出随机变量独立性的定义。
若随机变量 X,Y 满足对任意的 x,y∈R 都有
P(X≤x,Y≤y)=P(X≤x)P(Y≤y)
则称随机变量 X,Y 独立。
注意到,中学课本中对随机变量独立性的定义是用形如 P(X=α) 的概率定义的,但由于连续性随机变量取特定值的概率通常是 0,故在更一般的情形下借助分布函数定义才是更加明智的选择。
若随机变量 X,Y 相互独立,则对于任意函数 f,g,随机变量 f(X) 与 g(Y) 相互独立。
有时候我们会研究相互独立的随机变量 X,Y 的某一函数 f(X,Y)(如 XY2)的分布。
尽管 X 与 Y 是独立的,但不能想当然地认为对 Y 的某一取值 y,f(X,y) 与 f(X,Y) 服从同样的分布。