首页 > 编程知识 正文

poisson分布具有可加性,poisson分布独有的特征

时间:2023-05-04 20:14:36 阅读:260272 作者:601

转载自:http://episte.math.ntu.edu.tw/articles/sm/sm_16_07_1/index.html

这个来自台大的网站蛮多有意思的内容,要是能翻译成简体就更好了~

写的很清楚,适合放在教科书上。


曹亮吉

 

 

二項分布是離散型機率模型中最有名的一個,其次是 Poisson 分布,它可以看成為二項分布的一種極限情形。

假定某機關的總機在一個短時間 內會接到一次電話的機率p 與 成正比:,α 為一常數。又假定在此短時間內接到多於一次電話的機率微乎其微,可以略去不計。那麼在時間 t 內,會接到x 次電話的機率分布為何?

我們可以把 t 分成 n 小段,每小段長為。整個問題可看成為:在每個 時間內,我們做了一次試驗,其成功(接到電話)的機率為p。如此做了 n 次,那麼成功了x 次的機率為何?所以我們要的機率分布正是二項分布 b(x;n,p)。令,則


當 t 保持不變(亦即 λ 不變),而讓 (),則


所以

(以 表之,此處的 p 代表 Poisson)

因為


所以 的確是個機率分布(各種可能的機率之和等於 1)。

這就是說,在時間 t 內,接到 x 次電話的機率為。這是以 λ 為參數的 Poisson 分布,而 λ()是在時間t 內所期望接到的電話數。

Simeon D. Poisson(1781~1840年)是一個著名的法國數學家及物理學家。到了晚年,他熱衷於將數學的機率論用到司法的運作上。他在這方面的主要著作是1837年出版的《司法機率的研究》(Recherches sur la Probabilité des Jugements)。雖然這本書的主旨是要對司法運作有具體的貢獻,但它包含了許多純粹數學的、機率的理論,所以可以看成是一本以司法應用為例的機率課本,這本書德文版的書名《機率論及其重要應用》(Lehrbuch der Wathrscheinlichkeitsrechnung und deren wichtigstein Auwendungen) 看起來和內容較為一致。在這本書的數學推演中,Poisson 從二項分布的極限得到了這個日後以他為名的機率分布。

Poisson 雖然得到這樣的機率分布,但在書中他並沒有繼續討論這種分布的性質,在往後的研究中,Poisson 似乎也把它忘掉了。

在十九世紀的許多統計研究報告上,Poisson 這個名字經常出現,但這與 Poisson 分布無關,大家所關注的是他在常態分布方面的研究。常態分布在解釋理論與數據變異之間的關係非常成功,當時許多人認為常態分布是機率與統計之間唯一的橋梁了。

直到十九世紀末,Bortkiewicz 才注意到 Poisson 分布與某些數據之間也有類似的關聯。Ladislaus von Bortkiewicz(1868~1931年)是出生在俄國聖彼得堡的波蘭人。他在高兴的月饼 大學得到學位(1893年),並曾在 Strassburg 做過研究。在 Strassburg 時,他寫了一本小冊子《小數法則》(Das Gesetz der Kleinen Zahlen),專門研究 Poisson 分布。他不但在理論方面推演了 Poisson 分布的許多性質,並且在應用方面,也比較了一些實際發生的、有關於自殺或意外傷害的數據。Poisson 分布雖然出於 Poisson 之手,但真正使它為人重視,使它成為統計學一部分的可要算是 Bortkiewicz了。

在這本書中,Bortkiewicz 舉了一個至今仍是膾炙人口的例子,說明數據契合 Poisson 分布的情形。從1875到1894年的20年間,德國的十四個軍團部有士兵被馬踢傷因而致死的人數紀錄。這 20×l4 = 280個(團年)紀錄,按死亡人數來分,則如表一的左二欄所示。

x=每年死亡人數團年數280p(x;0.7)0144139.019197.323234.13118.0421.400.2

在280個紀錄中,死亡的人數共有196,因此致死率為 (人/團年)。我們就以此 α 為 Poisson 分布中的常數,t=1 年,則 。理想中每團每年死亡人數x 要遵行 Poisson 分布 p(x;0.7)。表一中右欄就是根據這樣的 Poisson 分布,把280團年該有x 人死亡的團年數列出。它和表一的中間一欄的數據的確相當吻合。

Poisson 分布既然是二項分布的極限情形,反過來 Poisson 分布也可以做為二項分布的近似值。譬如 p=0.04,n=49,則。我們把b(x;49,0.04) 與 p(x;1.96) 之值相對照就得表二

xb(x;49,0.04)p(x;1.96)00.1350.14110.2760.27620.2760.27030.1800.17640.0860.08650.0320.03460.0100.01170.0030.00380.0010.001

我們發現對應的值相當接近。一般,若用列表方式,則二項分布 b(x;n,p) 要兼顧三個變數x,n,p,而 Poisson 只要兩個:x,λ,所以較為方便。若直接計算,則因

b(x;49,0.04)=Cx49(0.04)x(0.96)49-x

所以二項分布算起來相當費事。另一方面 之值可用遞迴方法迅速求得: 或 ;而 可由指數表中查得。因此只要情況適合,我們當然就捨二項分布而就 Poisson 分布了。

通常只要 n 很大,p 很小, 不大不小而且是個已知定數,Poisson 分布就可以代替二項分布了,譬如某商店每星期進進出出的客人很多(=n),但每個客人買魚子醬的機率很小(=p),只知道平均一星期賣出兩罐:。那麼這家商店每星期開始時應有幾罐魚子醬的庫存?當然不能只有兩罐,因為平均歸平均,售量超過平均數的機率很大。當然庫存太多也會影響整個商店的運作。根據 Poisson 分布 p(x;2),我們算得表三:

λ012345p(x;2).135.271.271.180.090.036.017

由表三可知售量達到 5 罐以上的機率只有 5.3%,而達到 6 罐以上則只有 1.7%。所以合理的庫存量為 4 罐(平均19星期才會有一次缺貨),如果怕萬一,那麼 5 罐就非常保險(平均59星期才會有一次缺貨)。

我們從另一個角度來看上面的數據。假設某工廠每做100個螺絲釘,平均會有兩個不合規格,而這是合理的不合格率。根據 Poisson 分布,偶而出現 3 個或 4 個不合規格的螺絲釘也是正常的現象。但是如果出現的頻率太高,或出現 5 個以上的不合規格的螺絲釘,那麼生產過程就可能出了問題。Poisson 分布是品質管制的利器,它可以幫助我們決定生產過程是否出了毛病。

Poisson 分布還有種種的用途:放射性物質的蛻變、細胞間因受 X 光照射而引起的染色體交換次數、細菌和血球的計數、交通事故數及死亡率等等莫不遵行 Poisson 分布。其實,無論在自然科學、在工業、在農業、在商業、在醫藥、在交通、在社會或在軍事上,無不可找到 Poisson 分布的應用。

和二項分布一樣,我們也可以從理論方面來探討 Poisson 分布的期望值 μ 及散布差 。由,我們馬上算得


所以 Poisson 分布的確是以 λ 為期望值。

在〈二項分布與大數法則〉(《科學月刊》第十六卷第六期)一文中,我們曾導出二項分布的 Chebyshev 不等式


如果把二項分布換成 Poisson 分布或任何離散型分布,不等式也照樣成立,因為在導出不等式的過程中只用到 b(x;n,p) 是種機率分布這件事,並沒有用到b(x;n,p) 之值。現在既然知道 Poisson 分布的(=λ)是個(與n 無關的)定值,所以我們也可以得到關於 Poisson 分布的大數法則:


亦即:在 Poisson 分布的機率模型假定之下,只要試驗的次數 n 夠大,則事件發生的次數比,從機率的觀點來看,就會很接近期望值 λ。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。