- 大话机器学习:原理|算法|建模|代码30讲
- 叶新江编著
- 520字
- 2024-12-27 21:57:41
2.7 以上分布的总结和联系
讲到这里,我们就可以把正态分布、二项分布、泊松分布、指数分布联系在一起了。
(1)作为“正常形态”的分布,正态分布是最常见、最基础的分布。
(2)伯努利分布用来表示结果的两种可能(0/1,正/反,对/错等)发生的概率。
(3)二项分布是结果是两种可能事件发生n次后,其中某种结果出现x次的概率分布。
(4)泊松分布是用来计算在某一种事件发生频率确定的情况下,一段区间内发生次数的概率,一般这里要求事件本身发生的概率不是很大。
(5)在当事件发生次数n很大而事件发生概率p很小时,在没有计算机时,二项分布的计算非常麻烦,而用泊松分布来近似计算则可以降低大量的计算量。可以用λ=n×p来获得λ,然后通过泊松分布来计算。
(6)当二项分布中的p接近0.5时,它和正态分布就很近似,而n越大,就越接近。
(7)当λ≥20时,泊松分布可以用正态分布来近似;当λ≥50,泊松分布基本上就等于正态分布了。
(8)指数分布是通过泊松分布推导而得到的,泊松分布是用来计算某个区间内发生事件次数的概率,指数分布是用来计算某种事件发生的间隔时间。
(9)幂律分布和指数分布在图形上很接近,但是经过log-log运算处理后,幂律分布便是一条直线。社会上很多现象都可以对应到幂律分布上。