概率分布
概率分布(德语:Wahrscheinlichkeitsverteilung,英语:probability distribution)或简称分布,是概率论的一个概念。使用时可以有以下两种含义:
广义地,它指称随机变量的概率性质--当我们说概率空间中的两个随机变量X和Y具有同样的分布(或同分布)时,我们是无法用概率
来区别他们的。换言之:
称X和Y为同分布的随机变量,当且仅当对任意事件,有
成立。
但是,不能认为同分布的随机变量是相同的随机变量。
狭义地,它是指随机变量的概率分布函数。设X是样本空间上的随机变量,
为概率测度,则称如下定义的函数是X的分布函数,或称累积分布函数(简称CDF):
,对任意实数
定义。
具有相同分布函数的随机变量一定是同分布的,因此可以用分布函数来描述一个分布,但更常用的描述手段是概率密度函数(pdf)。
在常用的文献中,“分布”一词可指其广义和狭义,而“累计分布函数”或“分布函数”一词只能指称后者。为了不致混淆,下文中谈及上述的广义时使用“分布”一词;狭义时使用“分布函数”一词。
分布函数的性质刻划
对于特定的随机变量 ,其分布函数
是单调不减及右连续,而且
,
。这些性质反过来也描述了所有可能成为分布函数的函数:
设 且单调不减、右连续,则存在概率空间
及其上的随机变量 X ,使得 F 是 X 的分布函数,即
随机变量的分布
设为概率测度,
为随机变量,则函数
(
)称为
的概率分布函数。如果将
看成是数轴上的随机点的坐标,那么,分布函数
在
处的函数值就表示
落在区间
上的概率。
例如,设随机变量为掷两次骰子所得的点数差
,而整个样本空间由36个元素组成。
数量 | ||||
|---|---|---|---|---|
其分布函数是:
。
离散分布
上面所列举的例子属于离散分布,即分布函数的值域是离散的,比如只取整数值的随机变量就是属于离散分布的。表示随机变量
的概率值。如果X的取值只有
,则:
二项分布
二项分布是最重要的离散概率分布之一,由瑞士数学家雅各布·伯努利(Jakob Bernoulli)所发展,一般用二项分布来计算概率的前提是,每次抽出样品后再放回去,并且只能有两种试验结果,比如黑球或红球,正品或次品等。二项分布指出,随机一次试验出现的概率如果为,那么在
次试验中出现
次的概率为:
;
其中。
例如,在掷3次骰子中,不出现6点的概率约是:;
在连续两次的轮盘游戏中,至少出现一次红色的概率约为:。