概率論中最常用的一種離散型概率分佈。若隨機變數X取整數值k的概率為
式中 n是給定的正整數; 是從 n個對象中任意選取 k個的組合數,則稱 X的分佈為二項分佈,記作 B( n, p)。它的命名來源於 b( k; n, p)恰好是[(1- p)+ p] n的二項式展開的第 k+1項。從不合格品率為p的產品中獨立地抽出n個(每次抽一個,抽出後又放回),其中恰有k個不合格品的概率就是b(k;n,p);統計學由此建立檢驗產品質量的方案。類似的例子在生產實踐和科學試驗中是常見的。將這類問題模型化,假設每一次試驗隻有兩個可能結果:A以及它的對立事件Ac,出現A的概率為P(A)=p,出現Ac的概率則為1-p。這種隻有兩個可能結果的隨機試驗稱為伯努利試驗,將這種試驗獨立地重復進行n次所組成的隨機試驗稱為n重伯努利試驗,其中A出現的次數X是一個服從二項分佈B(n,p)的隨機變量。
若隨機變量服從二項分佈B(n,p),則它的數學期望為np,方差為np(1-p),特征函數為(1-p+peit)n,母函數為(1-p+ps)n。當k由0依次增大到n時,b(k;n,p)先增大後減小,當k=[(n+1)p](記號[α]表示不超過實數α的最大整數)時,b(k;n,p)取最大值;若(n+1)p是整數,則k在(n+1)p-1及(n+1)p處都使b(k;n,p)取最大值(見圖
)。如果Xi服從B(ni,p),i=1,2,…n,而且X1,X2,…,Xn獨立,則
服從 。如果 X n服從 B( n, p),則對任何實數 α< b,當 n→∞時,有 式中這說明,若p固定,當n充分大時,B(n,p)近似於正態分佈。這個漸近公式最早由A.棣莫弗就p=1/2的情形加以證明,而後由P.-S.拉普拉斯加以推廣,常稱為棣莫弗-拉普拉斯中心極限定理。S.-D.泊松又證明瞭:若則
這說明,當 p很小而 n較大時, B( n, p)可以用 泊松分佈近似。正是這兩個定理揭示瞭概率論中最重要的正態分佈和泊松分佈的意義,對概率論的發展有著深遠的影響。
此外,多重伯努利試驗中在出現第r個A以前A不出現的試驗次數的概率分佈就是負二項分佈,又稱帕斯卡分佈。特別當r=1時,就是幾何分佈。如果每次試驗的可能結果多於兩個,則二項分佈就推廣為多項分佈。