數理統計學的一個分支,其名稱源出於A.瓦爾德在1947年發表的一本同名著作,它研究的物件是所謂“序貫抽樣方案”,及如何用這種抽樣方案得到的樣本去作統計推斷。序貫抽樣方案是指在抽樣時,不事先規定總的抽樣個數(觀測或實驗次數),而是先抽少量樣本,根據其結果,再決定停止抽樣或繼續抽樣、抽多少,這樣下去,直至決定停止抽樣為止。反之,事先確定抽樣個數的那種抽樣方案,稱為固定抽樣方案。

  例如,一個產品抽樣檢驗方案規定按批抽樣品20件件,若其中不合格品件數不超過3,則接收該批,否則拒收。在此,抽樣個數20是預定的,是固定抽樣。若方案規定為:第一批抽出3個,若全為不合格品,拒收該批,若其中不合格品件數為x1<3,則第二批再抽3-x1個,若全為不合格品,則拒收該批,若其中不合格品數為x2<3-x1,則第三批再抽3-x1-x2個,這樣下去,直到抽滿20件或抽得3個不合格品為止。這是一個序貫抽樣方案,其效果與前述固定抽樣方案相同,但抽樣個數平均講要節省些。此例中,抽樣個數是隨機的,但有一個不能超過的上限20。有的序貫抽樣方案,其可能抽樣個數無上限,例如,序貫概率比檢驗的抽樣個數就沒有上限。

  H.F.道奇和 H.G.羅米格的二次抽樣方案(見抽樣檢驗)是較早的一個序貫抽樣方案。1945年,C.施坦針對方差未知時估計和檢驗正態分佈的均值μ(見數學期望)的問題,提出瞭一個二次抽樣方案。依此方案,在事先給定瞭l>0和0<α<1後,可作出均值μ的一個置信區間,其置信系數(見區間估計)為1-α,而長度不超過l。可以證明:當方差未知時,具有這種性質的置信區間在固定樣本的情況下不可能找到。由此可以看出序貫抽樣方案除瞭可節省抽樣量之外,還有一種作用,即為瞭達到預定的推斷可靠程度(這裡為置信系數)及精確程度(這裡是以區間長度來刻畫),有時必須使用序貫抽樣。例如,估計一事件A的概率p(0<p<1),給定ε>0及0<α<1,要找到這樣的估計舳,使能以不小於1-α 的概率保證估計的相對誤差|(舳-p)/p|≤ε。可以證明,若用固定抽樣方案,事先指定自然數n,做n次試驗,每次觀察A是否發生,則不論n多麼大,具有上述性質的舳不存在。但用下述序貫抽樣方案可得到這樣的舳:作試驗,觀察A是否發生,設到A第一次發生時已作瞭n1次試驗,計算出

,取其整數部分 n 2,再作 n 2次試驗,記 n 2次試驗中 A出現的次數為 m,令舳= m/ n 2,則有 p(|舳- p|/ p≤ε)≥1-α,而估計􀀻具有所指定的性質。

  第二次世界大戰時,為軍需驗收工作的需要,瓦爾德發展瞭一種一般性的序貫檢驗方法,叫序貫概率比檢驗(簡稱SPRT)。此法在他的1947年的著作中有系統介紹,其要點如下:設在原假設H0和備擇假設H1之下,隨機變量x的概率密度函數或概率函數隨機變量都已知,且分別為p0(x)及p1(x),對x逐次觀測,第i次觀測的結果記為xi,稱比值

為樣本 x 1x 2,…, x n的概率比。在固定抽樣方案之下,是先給定自然數 n,對 x進行 n次觀測得 x 1x 2,…, x n,計算 。定出一常數 C(其值取決於檢驗水平α),當 λ nC時,接受原假設 H 0,否則拒絕 H 0。這樣,在 λ n的值與 C很接近時, H 0是否被接受的界限過於斷然,不大合理。瓦爾德將此修改為:指定兩個數 ABAB,根據各次觀測得的樣本 x 1x 2,…的值,依次計算概率比 λ 1λ 2,…。每次抽樣完畢,即算出 λ n,再與 AB比較,若 λ nA,則接受 H 0;若 λ nB,則接收 H 1(拒絕 H 0);若 Aλ nB,則繼續抽樣一次得 x n +1,計算出 x n +1再作上述比較,直到作出決定為止。這就是序貫概率比檢驗。至於 AB的定法,則取決於指定的兩種錯誤概率α和β(α,β都大於0,但很小)。瓦爾德提供的近似公式是 A=β/(1-α), B=(1-β)/α。他也給出瞭這種檢驗法的平均抽樣次數和功效函數(見 假設檢驗),並在1948年與美國統計學傢J.沃爾弗維茨一起,證明瞭在一切兩種錯誤概率分別不超過α和β的檢驗類中,上述序貫概率比檢驗所需平均抽樣次數最少。瓦爾德在其著作中也考慮瞭復合檢驗的問題,有許多統計學者研究瞭這種檢驗。瓦爾德的上述開創性工作,引起瞭許多統計學者對序貫方法的註意,並繼續進行工作,從而使序貫分析形成為數理統計學的一個分支。

  除瞭檢驗問題以外,序貫方法在其他方面也有不少進展,對一般的統計決策問題,在各次觀測結果相互獨立的情況下的序貫貝葉斯解的問題,在理論上已有較完整的結果。在點估計方面,對序貫的最小化最大估計的研究有瞭一些結果。在區間估計方面,關於斯坦的二次抽樣,正態均值及一般總體均值和線性模型參數的區間估計,有不少的工作。另外,在數理統計學中有一類在應用上重要的問題,叫選擇問題,它要求從若幹個分佈中挑選出一個在某種意義上的最優者。例如,從若幹個具有不同均值的正態分佈中,挑選出其均值最大者。關於這個問題也發展瞭一系列的序貫方法。

  

參考書目

 A.Wald,Sequential Analysis,John Wiley &Sons,New York,1947.

 D.Siegmund,Sequential Analysis,Springer-Verlag,New York,1985.