概率分布

概率分布（德语：Wahrscheinlichkeitsverteilung，英语：probability distribution）或简称分布，是概率论的一个概念。使用时可以有以下两种含义：

广义地，它指称随机变量的概率性质－－当我们说概率空间中的两个随机变量X和Y具有同样的分布（或同分布）时，我们是无法用概率来区别他们的。换言之：

称X和Y为同分布的随机变量，当且仅当对任意事件，有成立。

但是，不能认为同分布的随机变量是相同的随机变量。

狭义地，它是指随机变量的概率分布函数。设X是样本空间上的随机变量，为概率测度，则称如下定义的函数是X的分布函数，或称累积分布函数（简称CDF）：

，对任意实数定义。

具有相同分布函数的随机变量一定是同分布的，因此可以用分布函数来描述一个分布，但更常用的描述手段是概率密度函数（pdf）。

在常用的文献中，“分布”一词可指其广义和狭义，而“累计分布函数”或“分布函数”一词只能指称后者。为了不致混淆，下文中谈及上述的广义时使用“分布”一词；狭义时使用“分布函数”一词。

分布函数的性质刻划

对于特定的随机变量，其分布函数是单调不减及右连续，而且，。这些性质反过来也描述了所有可能成为分布函数的函数：

设且单调不减、右连续，则存在概率空间及其上的随机变量 X ，使得 F 是 X 的分布函数，即

设为概率测度，为随机变量，则函数 ()称为的概率分布函数。如果将看成是数轴上的随机点的坐标，那么，分布函数在处的函数值就表示落在区间上的概率。

例如，设随机变量为掷两次骰子所得的点数差，而整个样本空间由36个元素组成。

其分布函数是：

。

上面所列举的例子属于离散分布，即分布函数的值域是离散的，比如只取整数值的随机变量就是属于离散分布的。表示随机变量的概率值。如果X的取值只有，则：

二项分布是最重要的离散概率分布之一，由瑞士数学家雅各布·伯努利（Jakob Bernoulli）所发展，一般用二项分布来计算概率的前提是，每次抽出样品后再放回去，并且只能有两种试验结果，比如黑球或红球，正品或次品等。二项分布指出，随机一次试验出现的概率如果为，那么在次试验中出现次的概率为：

；

其中。

例如，在掷3次骰子中，不出现6点的概率约是：；

在连续两次的轮盘游戏中，至少出现一次红色的概率约为：。