隨機事件出現的可能性的量度。它是概率論最基本的概念。在一個特定的隨機試驗中,稱每一可能出現的結果為一個基本事件,全體基本事件的集合稱為基本空間。隨機事件(簡稱事件)是由某些基本事件組成的,也就是基本空間的某些元素組成的集合(即基本空間的子集)。例如,在連續擲兩次骰子的隨機試驗中,用mn分別表示第一次和第二次擲出的點數,m>,n可以取值1、2、3、4、5、6,每一(mn)表示一個基本事件,因而基本空間包含36個元素。“點數之和為2”是一事件,它是由一個基本事件(1,1)組成的,可用集合{(1,1)}表示;“點數之和為4”也是事件,它由(1,3),(2,2),(3,1)三個基本事件組成,可用集合{(1,3)(3,1)(2,2)}表示。如果把“點數之和為1”也看成事件,則它是一個不含任何基本事件的事件,稱為不可能事件。常用Ω表示基本空間,ω表示基本事件,空集符號ø表示不可能事件。若A是一個事件,則“事件A不發生”也是一個事件,它由ΩA以外的諸元素組成,記作Ac,稱為A的對立事件。實際中要考察的各種各樣的事件及其相互關系,正與基本空間Ω中元素所組成的各種子集及其相互關系相對應,因而概率論與集合論的語言有如表

概率論與集合論的語言對照表

中的對照,事件的關系可以表示如圖1。

  在概率論中,並不總是把基本空間Ω的一切子集都當作事件。為瞭研究事件間的各種關系,記全體事件所構成的集類為F,它應具有以下性質:①Ω∈F;②若A∈F,則Ac∈F;③若AB∈F;則AB∈F。這樣的集類F稱為域或代數。從這三條性質還可以推出:ø=Ωc∈F;若AB∈F,則AB=(AcBc)c∈F。

  古典概率 古典概率討論的對象局限於隨機試驗所有可能結果為有限個等可能的情形。這時基本空間Ω由有限個元素或基本事件組成,其個數記為n。域F由Ω的一切子集組成。若事件A包含m個基本事件,則定義A的概率P(A)=m/n,這就是P.-S.拉普拉斯的古典概率定義,或稱之為概率的古典定義。

  歷史上有名的得分問題的解法是應用古典概率的一個典型例子:甲、乙二人各出同樣的賭註,用擲硬幣作為博弈手段。每擲一次,若正面朝上(+),甲得1分,乙不得分;若反面朝上(-),乙得1分,甲不得分。誰先得到事先約定的分數,就贏得全部賭註。當進行到甲還差2分,乙還差3分,就分別達到約定分數時,他們不願繼續賭下去,問這時如何公平分配賭註?顯然,為確保能分出勝負,最多需要再擲4次,共16種等可能的情形:{(++++),(+++-),(++-+),(++- - ),(+-++),(+-+-),(-+++),(-++-),(- --+),(- - - -),(+- -+),(-+-+),(- -++),(+- - -),(-+- -),(- -+-)}。其中使甲獲勝,即出現至少兩個“+”的情形有11種,使乙獲勝,即出現至少三個“-”的情形有5種,故甲勝的概率為11/16,乙勝的概率為5/16,因而甲和乙分別應得全部賭註的11/16和5/16。實際上,前四種情形表示隻需擲兩次就可分出勝負,往下的六種情形表示隻需擲三次即可分出勝負。但如果這樣表示,就不好用古典概率進行計算瞭。

  計算古典概率,可以如上例用窮舉法數清一個事件所含元素的個數,但借助於組合計算可以簡化計算過程。上例中,“甲勝”這一事件所含元素個數為

。這種用組合數學方法計算隻涉及有限個基本事件的概率問題,也稱組合概率。需要強調的是,這裡應十分註意“等可能”這個條件,即每一個基本事件具有相同的概率。J.le.R.達朗貝爾在考慮擲兩個硬幣的試驗中,曾錯誤地認為“出現一個正面朝上,一個反面朝上”的概率是1/3。事實上,此試驗有{(++),(+-),(-+),(- - )}四個等可能的基本事件,而出現一正一反這一事件含(+-)、(-+)兩個基本事件,其概率應為1/2。

  對於由有限個基本事件構成的古典概率模型,可以把事件A的概率P(A)看成是在事件域F上定義的函數,它具有下列三個性質:①對任意的事件A,0≤P(A)≤1;②必然事件Ω的概率為1;③若AB不相容,則P(AB)=P(A)+P(B)。其中③稱為可加性公式,它是計算概率的重要法則。例如有一批產品總數為1000,其中含10個廢品,從中隨機抽出20個,求這20個中有廢品的概率。用A表示這一事件,如直接計算A的概率,就要依次計算20個中恰有1個、2個、直至10個廢品的概率各為多少,再求和。但A的對立事件Ac是抽出的20個中不含廢品的事件,而它的概率容易計算,為

,根據③,即得

  幾何概率 在建立古典概率的同時,人們就註意到隻考慮取有限個元素構成的基本空間是不夠的。把等可能思想發展到含無窮多個元素的基本空間,就產生瞭幾何概率。其基本思想可以表達為:設Ω是平面上一個可求積的區域,域F由Ω中一切可求積的子集組成。設A∈F,μ(A)表示A的面積,隨意扔一個點到Ω中,按照等可能性的思想,可認為點落入Ω內任何一部分的概率與這一部分面積成正比,而與這一部分的形狀及其在Ω內的位置都無關,因此,落入A的概率P(A)=μ(A)/μ(Ω)。下述的佈豐(曾譯蒲豐)投針問題是一個應用幾何概率的典型例子。

  設平面上有一族平行線,每相鄰兩條之間的距離為2,取一枚長為1的針,隨意地把它扔到平面上,求針與直線相交的概率。用x表示針的中點到離它最近的一條平行線的距離,用θ表示針與平行線的夾角,如圖2

之a。( xθ)完全決定針所落的位置,針的所有可能的位置為0≤ x≤1,0≤ θπ,即圖2之b所示的矩形裡的每一個點,矩形的面積為 π。針與直線相交的充分必要條件是 它對應於圖2之b中帶陰影的部分,其面積等於 。用 A表示“針與直線相交”這一事件,則 P( A)=1/ π。由此,多次投針,計算它與直線相交的頻率,可以求出 π的近似值。雖然這樣做既費時又不精確,但這一思想有可取之處,因為在有瞭快速電子計算機之後,可以用電子計算機模擬投針試驗來計算 π的近似值,這樣就看出其優越性瞭。許多像求 π的近似值這樣表面上看起來和概率毫不相幹的問題,都可以用幾何概率加以解決。

  概率的頻率定義 隨著人們遇到問題的復雜程度的增加,等可能性逐漸暴露出它的弱點,特別是對於同一事件,可以從不同的“等可能性”角度算出不同的概率,從而產生瞭種種悖論,著名的貝特朗悖論就是一個典型的例子。另一方面,隨著經驗的積累,人們逐漸認識到,在做大量重復試驗時,隨著試驗次數的增加,一個事件出現的頻率,總在一個固定數的附近擺動,顯示出一定的穩定性。R.von米澤斯把這個固定數定義為該事件的概率,這就是概率的頻率定義(見概率論)。

  從應用角度看,頻率定義可以克服等可能性觀點不易解決的某些困難,但從理論上講,這種定義方法是不夠嚴謹的。概率論的進一步發展,要求人們從古典定義、幾何定義、頻率定義中吸取能反映規律性的本質性質,克服它們各自的局限性,抽象出一種合理的定義,它既把以前各種有實際意義的定義作為特殊包含在內,又能滿足現代科學對它所提出的更高要求,這就是Α.Η.柯爾莫哥洛夫的概率公理化定義。

  概率的公理化定義 設基本空間Ω是一個任意給定的非空集合,它的元素用ω表示。依據不同的考察對象,ω可以代表種種不同的基本事件,但這對概率論的邏輯發展而言是無關緊要的。事件的全體F是Ω的某些子集構成的集類,為瞭研究無窮多個事件的關系,除瞭如同前述域的定義中要求Ω∈F以及“若A∈F,則Ac∈F”之外,還要求把“F中任意兩個事件的並仍屬於F”這一條件,強化為如果任意可列多個事件A1A2…,都屬於F,則它們的並

也屬於F。這樣的域F稱為 σ域或 σ代數,也稱事件域。對於由無窮多個基本事件構成的基本空間,這種強化是具有本質上的重要性的。對給定的基本空間 Ωσ域F,概率的公理化定義如下:

  概率P是F上的實值函數,即對每一A∈F,有一實數P(A)與之對應,且滿足下面三條公理。

  ① 非負性 對一切A∈F,P(A)≥0;

  ② 規范性 P(Ω)=1;

  ③ 可列可加性 若A1A2,…∈F,且兩兩不相容,則

以上三條公理是古典概率性質的發展,從它們容易推出 P(ø)=0, P( A)≤1, P( A c)=1- P( A)等基本性質。公理③是把可加性公式擴展到可列無窮的情形,它在概率論中起著根本的作用。這樣的公理化模型是由三個基本要素組成的,記為( Ω,F, P),稱為概率空間,它是一般測度空間(見 測度論)的特例; P也稱為可測空間( Ω,F)上的概率測度。

  事件獨立性 獨立性是一個使概率論區別於測度論的特有概念。考慮“甲扔硬幣,乙擲骰子”的試驗,求事件“硬幣出現正面,骰子出現5或6”的概率。若把事件“硬幣出現正面”記作A,事件“骰子出現5或6”記作B,則所求的是事件AB的概率。整個試驗的基本事件的總數為12,而且是等可能的。A所含基本事件的個數為6,B所含基本事件的個數為4,而AB所含基本事件的個數為2,這樣P(A)=6/12=1/2,P(B)=1/3,P(AB)=1/6,於是有P(AB)=P(AP(B)。對於任意兩事件AB,如果它們各自發生的概率與它們同時發生的概率滿足P(AB)=P(AP(B),則稱它們為獨立的。結合上例,獨立性的這一定義與直觀是一致的,因為甲和乙作試驗是單獨進行而互不影響的。對於n(n≥2)個事件A1A2,…,An,如果對所有可能的組合都有

則稱這 n個事件獨立。這裡,集合的有限交的記號∩常被省去,如 A A ,記為 A A A ∩…∩ A 則簡記為 ,而以上的 n-1組關系式必須都成立,缺一不可。

  下面的例子說明存在這樣的三個事件ABC,它們是兩兩獨立的,但整體上並不獨立。考慮一正四面體,一面為紅色,一面為藍色,一面為黃色,剩下的一面為紅藍黃三色。以ABC分別表示扔四面體時朝下的一面出現紅、藍、黃的事件,於是有P(A)=P(B)=P(C)=1/2,且P(AB)=P(AC)=P(BC)=1/4,故ABC兩兩獨立,但是P(ABC)=1/4,P(A)P(B)P(C)=1/8,二者並不相等。

  條件概率 獨立事件同時發生的概率很容易從它們各自發生的概率算出,而為瞭計算不獨立事件同時發生的概率就需要用到條件概率。設某城市有N個男人和M個女人,其中患色盲者男性n人,女性m人。用Ω表示全體居民的集合,A表示全體女性居民的集合,B表示全體色盲患者的集合。某工廠要招聘一名化驗員,要求不是色盲患者,問任意一位應聘的女性被廠方拒絕的概率是多大?這裡所求的就是“女性中色盲患者”的概率,用記號PBA)表示。按等可能性原則,

,或 P( A B)= P( A) P( B| A)。一般地,若 P( A)>0,稱 P( A B)/ P( A)為“已知 A時, B的條件概率”,或“ B關於 A的條件概率”,記作 P( B| A)。當 A固定, B取遍F中的事件時,條件概率 P(·│ A)作為F上的函數,也具有公理化定義中概率的那些性質。如果對某個 BP( BA)= P( B),那麼 P( A B)= P( A) P( B| A)= P( A) P( B),這表明 AB獨立。關系式 P( BA)= P( B)可解釋為不論有沒有“已知 A”的條件, B的概率不變,這是符合 AB獨立的直觀意義的。

  關於條件概率有三個重要公式:

  ①一般乘法公式設A1A2,…An∈F,n≥2,P(A1A2An-1)>0,則

  ② 全概率公式 設A1A2,…∈F,兩兩不相容,

,對一切 n成立,則 P( A)=

對一切 A∈F成立。

  ③ 貝葉斯公式 在②的條件下,對滿足P(A)>0的A,有

  歷史上有名的配對問題的解決是應用條件概率的典型例子。設有n個信封和n張信紙,分別編號為1至n,把信紙隨意裝進信封裡,一個信封裡恰好隻裝一張信紙,求“沒有一個對號”這一事件的概率P0,以及對每一正整數r(rn),求“恰有r個對號”的概率Pr

  用Ai表示事件“第i號信紙恰裝入第i號信封”,則PAi)=1/n。在Ai發生的條件下,第j號信紙共有n-1個信封可供選擇,故PAjAi)=1/(n-1),因此PAiAj)=1/nn-1),其中ij。類似地,對1≤i1i2<…irn

,從而

。根據逐步淘汰原則,至少有一個對號的概率是

,從而

。再計算 P r,由於對指定的某 r張信紙,它們都對號的概率為 餘下的 n- r張信紙沒有一張對號的概率為 (即在 P 0中以 n- r代替 n),而 r張信紙對號共有 種選法,故

  以上隻是就已知單個事件發生為條件定義的條件概率,這是簡單情形的條件概率。由於人們對非獨立性的認識逐步深入,用簡單情形的條件概率不能滿意地刻畫深化瞭的非獨立性,而需要就更一般的情形來定義條件概率。這一定義隻是在有瞭測度論之後才能嚴格給出(見條件期望)。