概率論的基本概念之一,用以表述隨機變數取值的概率規律。為瞭使用的方便,根據隨機變數所屬類型的不同,概率分佈取不同的表現形式。

  離散型分佈與分佈列 隻取有限個或可列個實數值的隨機變數稱為離散型隨機變數。例如,1000件產品中有50件次品,從中隨意抽取100件,則其中的次品數X就是一個隻取0到50之間的整數值的離散型隨機變數。又如如一個電話交換臺每天收到的呼叫次數X就是一個可取全部非負整數值的離散型隨機變量。設離散型隨機變量X所取的全部值為{x1x2,…,xn,…},記事件{X=xk}的概率P(X=xk)=pkk=1,2,…,n,…,於是二元序列{(xkpk),k=1,2,…,n,…}表述瞭X取值的概率規律。這個二元序列稱為分佈列。可用分佈列來表述的離散型隨機變量取值的概率規律稱為離散型分佈。由概率的基本性質可知,任一分佈列必然滿足條件:pk≥0,

(若隨機變量隻取 n個值,則有 )。

  上述表達形式也適用於隨機向量的情形,這隻須把X理解為m維隨機向量X=(X1X2,…,Xm),xk理解為m維向量值

,事件{ X= x k}的概率 p k理解為

。相應的分佈列所表述的概率規律稱為 m維離散型分佈。

  分佈函數與邊緣分佈函數 對於那些取值充滿一個區間[αb]、甚至充滿整個實數軸R=(-∞,∞)的隨機變量,就不可能用分佈列的形式來表述它取值的概率規律,一般可統一用分佈函數來表述。設X是一個隨機變量,x是任一實數,事件{Xx}的概率P(Xx)=F(x),xR,稱為X的分佈函數;在數理統計學中也稱為累積分佈函數。由概率的性質知道,任何分佈函數F(x)都滿足以下三個條件:

  ① 單調非降,即當αb時,F(α)≤F(b);

  ② 右連續,即

,其中 bα+表示 bα且趨近於 α

  ③

。反之,任一滿足這三個條件的函數,必是某一隨機變量的分佈函數。用分佈函數可以表示 X落入某個區間的概率,例如當 αb時, P( αXb)= F( b)- F( α), P( αXb)= F( b)- F( x)= F( b)- F( α-)。圖1畫出瞭一個分佈函數的圖像。

  如果X是一個離散型隨機變量,它的分佈列為{(xkpk),k=1,2,…,n,…},那麼由概率的可列可加性知道,X的分佈函數可以表為

其中右邊的求和式表示對滿足 x kx的一切下標 k求和。圖2畫瞭一個這種類型的分佈函數。

  分佈函數的定義也容易推廣到隨機向量的情形。設X=(X1X2,…,Xm)是一個m維隨機向量,x=(x1x2,…,xm)是任一m維實向量,令

,則函數 F( x 1x 2,…, x m)稱為 Xm維分佈函數,或稱為 m個隨機變量 X 1X 2,…, X m的聯合分佈函數。 m維分佈函數也有與一維情形相應的充分必要條件,但敘述較為復雜。

  利用X1X2,…,Xm的聯合分佈函數F(x1x2,…,xm),可以求出其中任何一部分隨機變量的分佈函數,後者稱為前者的邊緣分佈函數。以兩個隨機變量X1X2為例,設它們的聯合分佈函數為F(x1x2),則X1X2的兩個邊緣分佈函數分別為

  連續型分佈與密度函數 實際中最常遇到的隨機變量的類型除離散型以外,還有連續型隨機變量。如果存在一非負實函數p(x),使隨機變量X的分佈函數F(x)可以表成:

則稱 X為連續型隨機變量, p( x)稱為 X的密度函數,它一定滿足條件

可以用密度函數來表述的隨機變量取值的概率規律稱為連續型分佈。連續型隨機變量 X取任何一個實數值的概率等於0;當實數 αb時,可以用密度函數在區間[ αb]上的積分計算事件{ αXb}的概率,即:

這個概率又可以用圖3中陰影部分的面積來表示。

  如果存在一個m元實函數p(x1x2,…,xm),使m維隨機向量X=(X1X2,…,Xm)的分佈函數F(x1x2,…,xm)可以表示成

   

p( x 1x 2,…, x m)稱為隨機向量 Xm維密度函數,或稱為 m個隨機變量 X 1X 2,…, X m的聯合密度函數。若兩個隨機變量 X 1X 2有聯合密度函數 p( x 1x 2),則 X 1X 2自身也分別有密度函數 p 1( x 1)和 p 2( x 2),且可以由下式算出:

\ n

p 1( x 1), p 2( x 2)分別稱為 p( x 1x 2)的邊緣密度函數。類似地,可以考慮 m 維密度函數的邊緣密度函數。

  概率分佈的測度形式 有時,主要是為瞭理論研究的方便,還需要有一種表述隨機變量與隨機向量取值的概率規律的更一般的形式。對給定的正整數m,用Rm表示全體m維實向量構成的集,稱為m維實空間,對於α=(α1α2,…,αm)

,用符號( αb]表示 R m中如下的超長方體:( αb]={ xR mx=( x 1x 2,…, x m), α jx jb j( j=1,2,…, m),又用 B m表示由 R m中的一切超長方體產生的 σ域,稱為 m維波萊爾域, B m中的成員稱為 R m中的波萊爾集。由隨機變量的公理化定義可知,若 X為概率空間( Ω,F, P)上的 m維隨機向量,則對任一 B∈B m有{X∈ B}∈F。對每一 B∈B m,定義 P X( B)= P(X∈ B),則 P X是可測空間( R m,B m)上的一個概率測度(見 概率)。這個概率測度 P X一般也稱為隨機向量 X的概率分佈。

  實際上,對於不同類型的隨機變量X,它的概率分佈PX分別被它的分佈列、密度函數和分佈函數完全確定。以一維情形(m=1)為例,對於任一B∈B1,其PX(B)分別為:

式中最後一個積分是勒貝格-斯蒂爾傑斯積分。

  隨機變量的函數的分佈 一個或多個隨機變量的連續函數或初等函數(甚至更一般的波萊爾可測函數)仍然是隨機變量,而且後者的分佈由前者的分佈完全確定。這一事實無論在理論上或實際計算上都是重要的。例如,設隨機變量X的分佈函數為F(x),α(>0)及b是二實數,則Y=αX+b也是隨機變量,它的分佈函數

又如隨機變量 X 1X 2有聯合密度函數 p( x 1x 2),則 X= X 1+ X 2Y= X 1/ X 2也是隨機變量(在後者中,假定 X 2≠0)),它們分別有密度函數

  數學期望 見數學期望。

  方差 見方差。

  中位數與分位數 設X是隨機變量,同時滿足PXx}≥1/2及PXx}≥1/2二式的實數x,稱為X的中位數,記作mXx1/2。中位數對於任何隨機變量都是存在的,但可能不惟一。它是反映隨機變量取值中心的一個數值。在理論上,特別對數學期望不存在的情形,它可以起到類似於數學期望的作用。它與期望相比,主要優點是受極端值的影響較小,因此在某些應用統計問題中,用它代替平均數作為一個主要指標。

  將中位數的概念推廣,可以引進數理統計學中常用的分位數的概念。給定0<α<1,隨機變量X的上α分位數是指同時滿足下列兩條件的數xαPXxα}≥1-αPXxα}≥α。中位數就是1/2分位數。x1-α又稱為X的下α分位數。

  特征函數 傅裡葉變換是數學分析中非常重要而有效的工具,將它應用於概率論,對分佈函數作傅裡葉-斯蒂爾傑斯變換,就得到特征函數。由於它具有很好的性質,因此在研究隨機變量之和及其概率分佈時起著十分重要的作用。在P.萊維於1919年至1925年系統地建立概率論中的特征函數性質以後的15年間,它被用來完整地解決瞭普遍極限定理(見中心極限定理),並深入地研究瞭獨立增量過程。

  設F(x)是隨機變量X的分佈函數,則稱

( tR)為 F( x)或 X的特征函數。特別,若分佈是具有密度函數 p( x)的連續型分佈,則

若分佈為

       P(X=xk)=pk(k=1,2,…),的離散型分佈,則

  特征函數的重要性質有:①f(0)=1;②│f(t)│≤1,tR;③f(t)在R上一致連續且具有非負定性,即對任意正整數n,任意實數t1t2,…,tn,及任意復數z1z2,…,zn,有

;④若 Xr階絕對矩有窮,則對一切正整數 kr,它的特征函數的 k階導數存在,且 因而有 在特征函數已知的情況下,用這類公式來求各階矩往往是方便的。如果隨機變量 X 1X 2,…, X n是獨立的,則 X 1X 2+…+ X n的特征函數等於 X 1X 2,…, X n各自的特征函數的乘積。這一性質使特征函數在研究極限定理(見 中心極限定理)時起著重大的作用。

  特征函數與分佈函數相互惟一決定,因而可以把求分佈函數的問題轉化為求特征函數的問題。不僅如此,在特征函數序列與分佈函數序列的收斂性之間也存在對應關系。稱分佈函數序列{Fn(x),n≥1}弱收斂(見概率論中的收斂)於分佈函數F(x),如果在F(x)的每一連續點x上,都有

。於是,成立如下的定理:設分佈函數序列{ F n( x)}弱收斂於分佈函數 F( x),則相應的特征函數序列{ f n( t)}收斂於 F( x)的特征函數 f( t),而且在 t的任一有限區間上收斂是一致的。反之,設特征函數序列收斂於一個在 t=0處連續的函數 f( t),則 f( t)是特征函數,而且相應的分佈函數序列弱收斂於以 f( t)為特征函數的分佈函數 F( x)。這是解決中心極限問題時的一個關鍵性的定理。應用它,還可以證明: R上的復值函數 f( t)為特征函數的充分必要條件是 f( t)連續、非負定且 f(0)=1。這是特征函數的一個判定條件,而且在證明 平穩過程協方差函數的譜表示時需要用到這個定理。

  上述有關一維概率分佈的特征函數的概念與結果,都可以推廣到多維的情形。

  半不變量 設隨機變量X具有s階絕對矩,則它的特征函數f(t)s次連續可微,令

它稱為 Xr階半不變量。因此有

式中符號 O( t s)表示當 t→0時比 t s高階的無窮小量,即 X的前幾階半不變量是:

…………。

給定前兩階半不變量k1k2,其最簡單的特征函數是exp

,即正態分佈 N( k 1k 2)的特征函數。

  母函數 它是代替特征函數專門用於研究非負整值隨機變量的一個有用的數學工具,歷史上,它的引進比特征函數更早。設X是隻取非負整數值的離散型隨機變量,P(X=k)=pkk=0,1,…,則稱

X或其概率分佈的母函數。由冪級數的求導性質知, P( s)在(-1,1)中有任意階導數,且 p k= (0)/ k!, k=0,1,…,因此,母函數與取非負整值的離散型分佈相互惟一決定。母函數還具有如下的重要性質:當 X的數學期望存在時,EX= P′(1);當 X的方差有窮時,

;任意 n個獨立的非負整值隨機變量之和的母函數,是這 n個隨機變量的母函數的乘積;設 vX 1X 2,…是一列獨立的非負整值隨機變量,而且 X 1X 2,…有相同的概率分佈,其共同的母函數為 P( s), v的母函數為 G( s),則隨機變量 的母函數為 G( P( s));此外,若 E vE X 1存在,則 E Y= E v· E X 1

  常用概率分佈表 表列舉瞭概率論與數理統計學中常用的概率分佈(包括取整數值的離散型分佈及連續型分佈),它們的名稱與標準記號,分佈列或密度函數表達式及部分密度函數的圖形,相應的數學期望與方差(如果存在),以及相應的特征函數。另外,還加瞭若幹有用的附註。表中的XN(ασ2)表示隨機變量X服從期望為α、方差為σ2的正態分佈。

常用概率分佈表

常用概率分佈表 續表1

常用概率分佈表 續表2

常用概率分佈表 續表3

  

參考書目

 J.K.Patel,C.H.Kapadia and D.B.Owen,Handbork of Statistical Distributions,Marcel Dekker,New York,1976.