先说明一下背景,不小心解开了《吴军的数学讲义》这本书,看到概率论的一部分觉得有点疑惑,加上那一年概率论几乎没有上课,自己在网上研究了半天,才知道其中的区别。 以下,从与数学pcdmj近似的角度对各种分布的使用场景进行说明。
二项分布:二元分布特征:
1、做某事的次数是一定的,用n表示
2、每次活动两个可能的结果(成功或失败) ) ) ) ) ) )。
3、成功概率每次相等,成功概率用p表示
4、你感兴趣的是x次成功的概率是多少
例如,每次买彩票只有两个概率:中不中。 如果中奖概率是10%,我想知道买100次彩票中了几次奖。 那么使用二元分布:
几何分布: 1、做某事的次数一定,用n表示
2、每次活动两个可能的结果(成功或失败) ) ) ) ) ) )。
3、成功概率每次相等,成功概率用p表示
4、你感兴趣的是进行x次尝试,第一次成功的概率是多少
类似于上面的二元分布。 不同的是你想知道的结果不同。 我想知道我买十次彩票一定能成功一次的概率是多少。 有人说100%。 因为当选率是10%。 但是,现实并不是每10秒就能击中一次,所以用几何分布来计算。
泊松分布: 1、事件独立
2、在任意相同的时间范围内,事件发生的概率相同
3、我想知道在某个时间范围内,某个时间x发生的概率是多少
泊松分布是计算某个时间或空间发生事件概率的方法之一。 也就是说,我们知道集体样本的平均值,并且在计算某些样本的值是多少时使用泊松分布。 好像不太理解,举个例子,假设一个培养皿里有100ml培养液,平均每mL有10个细菌,那么取出1ml培养液,里面正好有n个细菌的概率是多少? 此时使用泊松分布。
从公式来看,二元分布和几何分布使用了n (在几何分布中为x )。 不同的是,我想知道二元分布会成功几次,几何分布在这么多次数下成为一次的概率是多少。 (让我想起了DNF的武器强化。 另一方面,泊松分布不使用n,即具体样本是多少,而是用于计算某个时间内某事发生k次的概率。 (这里的=n*p是指平均值,有可能通过统计学直接得到平均值。
清新的过去分布:
顺便说一下,关于清爽的过去分布,大规模的样本数据在知道方差和期待的情况下,一般被认为遵循清爽的过去分布。 用统计数据建模时可以使用清爽的过去分布。
总结:都是数学工具。 使用场景不同。 你不需要在意其中的数学联系。 作为道具,你只需要知道什么时候使用哪个道具比较方便就可以了。