數學的一個分支學科。研究怎樣去有效地收集、整理和分析帶有隨機性的資料,以對所考察的問題作出推斷或預測,直至為採取一定的決策和行動提供依據和建議。數理統計學可用於種種專門領域(物理、化學、工程、生物、經濟、社會等),但隻涉及其中有關帶隨機性的資料的分析問題,而不是以任何一種專門的知識領域為研究物件。但是,在用數理統計方法分析帶隨機性的資料時,從統計模型的選擇、實驗方案的制定、統計方法的正確作用以至所得結論的恰當解釋,都離不開所論問題的專門知識。

  在英語中,統計學(statistics)一詞系由state(國傢)衍化而來,意指由國傢收集的有關國情的資料。在中國的《二十四史》和其他典籍中,可看到不少關於錢糧戶口、水災地震等數字記載,這類記載可以看成是統計學的濫觴,但還不是現代意義下的數理統計學,因為它隻是有關事實的記錄和整理,而沒有在一定理論的指導下,作出超越數據范圍之外的推斷。例如,在概率論和近代數學發展起來以前,沒有也不可能根據已有的人口數據,去建立一定的模型以預測人口發展的趨勢,或者根據已有的地震數據,去建立一個模型以預測今後若幹年內的地震。在概率論發展以前,社會調查多是采取普查的形式,不需要處理因抽樣的隨機性所產生的問題。常把這種收集、記錄和整理數據的工作稱為描述性統計。

  數理統計學是伴隨著概率論的發展而發展起來的,當人們認識到,必須把數據看成是來自具有一定概率分佈的總體,所研究的對象是這個總體而不能局限於數據本身之日,也就是數理統計學誕生之時。這一點始自何時,在專傢中沒有一致的意見。從現有資料看,在19世紀中葉以前已出現瞭若幹重要的工作,特別是C.F.高斯和A.-M.勒讓德關於觀測數據誤差分析和最小二乘法的研究。到19世紀末期,經過包括K.皮爾森在內的一些學者的努力,這門學科已開始形成。但數理統計學發展成一門成熟的學科,則是20世紀上半葉的事,它在很大程度上要歸功於K.皮爾森、R.A.費希爾等學者的工作。特別是費希爾的貢獻,對這門學科的建立起瞭決定性的作用。1946年H.克拉默發表的《統計學數學方法》,是第一部嚴謹且比較系統的數理統計著作,可以把它作為數理統計學進入成熟階段的標志。

  數理統計學一詞有一種狹義的理解,即僅指有關統計方法的數學理論。在美英等國多是這樣理解的。統計方法的數學理論研究中用到很多近代數學的知識,主要的如分析學與函數論、矩陣代數、組合數學,也用到泛函分析、拓撲學和抽象代數的知識。但與數理統計學關系最密切的是概率論。在很大程度上可以說:概率論是數理統計的基礎,數理統計是概率論的一種應用。但是,它們是兩個並列的數學分支學科,並無從屬關系。

  統計工作諸環節 用數理統計方法去解決一個實際問題時,一般有如下幾個步驟:建立數學模型,收集整理數據,進行統計推斷、預測和決策。這些環節不能截然分開,也不一定按上述次序,有時是互相交錯的。例如,在建立模型時往往要參考所掌握的數據,在整理數據時,要考慮到擬作的統計推斷的形式,等等。

  模型的選擇和建立 在數理統計學中,模型是指關於所研究問題的總體的某種假定,一般是給總體分佈規定一定的類型。有的假定不直接涉及總體分佈形式,如在回歸分析中,常假定回歸函數為線性的,稱為線性回歸模型。這一假定與總體分佈所屬類型無關。建立模型要依據概率論的知識、所研究的問題的專業知識、以往的經驗以及從總體中抽取的樣本(數據)。例如,依概率論的中心極限定理,在分析測量誤差時,有理由選擇正態分佈作為模型;在電子元件的老化作用可以忽略不計的時段內,有理由假定其壽命服從指數分佈;等等。在有些實際問題中,並無足夠的理論根據去選擇一種特定的模型,而需要利用數據。例如,把數據描在各種概率紙上,看它們在哪一種概率紙上與直線最接近,就選那種分佈為模型。根據理論選定的模型,也要用數據去檢驗它是否符合實際,其中涉及很多理論問題。

  數據的收集 有三種方式:全面觀測,抽樣觀測和安排特定的實驗。

  全面觀測又稱普查,即對所研究的總體的每個個體都加以觀測,測定所需要的指標值,如人口普查。如果不計普查過程中可能發生的重復、遺漏、誤記等人為性錯誤,則普查結果沒有隨機性可言。而且,普查既然對總體的所有個體都作瞭觀測,就不存在由所得數據去對總體作出統計性的推斷的問題。因此,全面觀測不屬於數理統計學的研究范圍。但是,全面觀測所得的數據的加工整理也用到數理統計學的方法和概念。

  抽樣觀測又稱抽查,是指從一些有形的個體組成的總體中抽取一部分,測定其有關的指標值。例如,在全國人口中抽取十分之一作調查。為使抽出的這一部分個體在總體中有盡可能大的代表性,對抽樣方法要作適當安排。這方面的研究內容構成數理統計的一個分支學科,叫抽樣調查。一個最簡單且最常見的要求是;總體中的每一個體要有同等的機會被抽出。在抽樣觀測中,隨機性一般表現在:樣本中包含哪些個體,是出自機會,而不是在抽樣前預定的。有一種所謂“判斷性抽樣”,或稱“典型抽樣”,是根據抽樣者的判斷抽取他認為合適的若幹個體作調查。在這種情況下,隨機性的影響無法考慮,因而不屬於數理統計學的研究范圍。

  安排特定實驗以收集數據,可以理解為通過實驗去“造出”總體中的個體(的指標)。例如,在同樣的條件下重復測定一個物理常數,會得出不盡相同的數值。所有可能的測定值構成一個總體,它並非有形地存在著,而是每做一個實驗,就“造出”其中一個個體。在一定的生產條件下,所能生產出的某種工業產品的質量指標構成的總體,也屬於這種性質,即:每生產出一件產品並測出其質量指標時,就“造出”其中一個個體。由此可見,通過實驗收集數據與抽樣觀測不同之處,在於前者是從一個無形且無限的總體中抽樣,而在後者,總體是有形且一般是有限的。

  實驗需要有計劃地安排。如為試制一種工業品,有幾種原材料和設備可選用,生產的各種工藝因素溫度、壓力、反應時間等,又可各有若幹個可選用的水平。因此,全部可能的搭配數很多,一般為人力物力時間所限,隻能挑選一部分去做實驗。所挑的一部分要有代表性,並使所得數據便於進行分析。這裡面所包含的數學問題,構成數理統計學的一個分支學科實驗設計法的內容。

  數據整理 目的是把包含在數據中的有用信息提取出來。一種形式是制定適當的圖表,以反映隱含在數據中的粗略的規律性或一般趨勢。另一種形式是計算若幹特征數字,以刻畫樣本某些方面的性質。如樣本均值和樣本方差分別反映瞭樣本內各數值的平均水平及差異程度。這種特征數字在數理統計學中稱為統計量,它的研究有重要的理論和實際意義,所得到的成果可用於指導數據的整理和統計推斷方法的選擇。

  統計推斷 指根據總體模型以及由總體中抽出的樣本,作出有關總體分佈的某種論斷。數據的收集和整理是進行統計推斷的必要準備,但它沒有越出所觀察的事物的范圍,是屬於前述的描述性統計的范疇,而不是統計推斷。後者的特征是:推斷的內容必須涉及總體。例如,從整批1萬件產品中隨機抽取200件作檢查。算出這200件的廢品率為2%。這確切描述瞭抽出的這200件產品的質量情況。若由此跨出一步,以2%這個數作為整批產品的廢品率p的估計,則構成一個統計推斷。

  統計預測 統計預測的對象,是隨機變量在未來某個時刻所取的值,或設想在某種條件下對該變量進行觀測時將取的值。例如,預測一種產品在未來三年內的市場銷售量,武漢市明年的長江最高水位,某個10歲男孩在兩年後的身高,等等。統計推斷與統計預測在兩個方面有相似之處:一是都要依據一定的統計模型和觀測數據,二是都要越出已觀察的事物的范圍。不同之處在於:統計推斷的對象是總體分佈的某一方面,如分佈中所包含的一個參數的值,它雖是未知的,但並無隨機性;統計預測的對象則不僅未知,且是隨機的。例如,估計由全體12歲男孩的身高構成的總體的均值,是統計推斷問題;若要問一個指定的10歲男孩兩年後將長到多高,則是一個統計預測問題。預測和推斷也不能截然分開,在許多情況下,為瞭進行預測,必須先做統計推斷。例如,當用線性回歸方程作預測時,有必要先估計回歸方程中的系數,而這屬於統計推斷問題。

  統計決策 不少實際問題的解決,最後要落實到一定的行動。統計決策就是依據所做的統計推斷或預測,並考慮到行動的後果(以經濟損失的形式表示),而制定的一種行動方案。目的是使損失盡可能小,或反過來說,使收益盡可能大。例如,一個商店要決定今年內某種產品的進貨數量,商店的統計學傢根據抽樣調查,預測該產品本店今年銷售量為1000件。假定每積壓一件產品損失20元,而少銷售一件產品則損失10元,要據此作出關於進貨數量的決策。一般,在作決策時要考慮其他方面的因素,而不完全是統計決策。但隻要在決策所依據的條件中有受到偶然性影響的成分,則數理統計方法總是有用的。從廣義的意義說,統計推斷(或預測)也可視為一種行動。這帶來一種新觀點,就是把損失的概念引伸於評價所作統計推斷的優劣。這種看法豐富瞭統計推斷理論的內容,使得有可能用統一的觀點去研究種種形式不同的統計推斷。這正是A.瓦爾德在1950年提出統計決策理論的出發點。

  分支學科 數理統計學內容龐雜,分支學科很多,難於作出一個周密而無懈可擊的分類。大體可以劃分為如下幾類。

  第一類分支學科包括前面已提到的抽樣調查和實驗設計。它們討論在觀測和實驗數據的收集中有關的理論和方法問題,但並非與統計推斷無關。因為收集數據是為瞭爾後作統計推斷之用,在制定收集數據的方案時要以此為準繩。

  第二類分支學科為數甚多,其任務都是討論統計推斷的原理和方法。各分支的形成是基於:①特定的統計推斷形式。例如,主要的統計推斷形式有參數估計和假設檢驗兩種,它們各自構成數理統計學中的基礎性的重要分支。②特定的統計觀點。例如貝葉斯統計與統計決策理論,它們都是從一種基本觀點出發去處理全部統計推斷問題。③特定的理論模型或樣本結構。例如非參數統計、多元統計分析、回歸分析、相關分析、序貫分析、時間序列分析和隨機過程統計。其中,非參數統計之所以形成一個分支,是因為所討論的問題有一個公共特性:其總體分佈族包羅的內容很廣泛,不能用有限個實參數去刻畫;多元統計分析的特點則在於所討論的統計總體必是多維的;等等。這種分支學科不是以某一種特定的統計推斷形式為研究對象,而要涉及各種統計推斷形式,它們既研究統計理論,也研究統計方法。這種統計方法是共性的,即可用於來自各種不同的專業領域中的實際問題,而不是以一種特定的應用領域為對象。

  第三類是一些針對特殊的應用問題而發展起來的分支學科,如產品抽樣檢驗、可靠性統計、統計質量管理等,它們都不涉及或很少涉及任何一種專門學科的知識,以此才被認為是一個統計分支。在這種分支學科中,一般都需要同時考慮數據的收集和統計推斷兩方面的問題。例如,產品抽樣檢驗的任務是制定從一批產品中作隨機抽樣的方案,並依據由此獲得的樣本去決定是否接受該批產品,這裡面有抽樣方案的統計問題,也有使用數據作統計假設檢驗的問題。

  還有一些分支學科,它們的任務是討論統計方法在某一特定學科中的應用,例如生物統計、計量經濟學、氣象統計、地質統計等,這些分支因為涉及大量有關學科的專門知識,不好認為是數理統計學的一個分支,可以看作是一種邊緣學科分支。

  對上面所提的分支學科名單及其分類,也還存在某些問題。例如有的意見認為第三類中的產品抽樣檢驗等不應列為數理統計的分支學科,隻是數理統計方法的一種應用。另外,在上面提到的一些分支之間,存在著內容重復交叉以至在一定意義下有包含關系的情況。例如,時間序列分析可以認為是更一般的隨機過程統計的一部分,回歸分析、相關分析中的許多內容可歸入多元統計分析內;假設檢驗中的非參數檢驗部分是非參數統計的主要內容。

  應用 數理統計方法在工農業生產、自然科學和技術科學以及社會經濟領域中都有廣泛的應用,然而按其性質來說,基本上是一個輔助性的工具,它的恰當應用依賴於所論問題的專門知識、經驗,以至良好的組織工作。

  數理統計方法在農業中應用的一個主要方面,是對田間試驗進行適當的設計和統計分析。實驗設計的基本思想和方法,就是從田間試驗開始發展起來的。象種子品種、施肥的種類和數量以及耕作方法的選定,都需要通過試驗。農業試驗由於周期長且環境因素變異性大,特別需要對試驗方案作精心的設計,並使用有效的統計分析方法。數理統計方法在農業中應用的另一方面是數量遺傳學的方法。例如,培育高產品種的研究中的數據分析使用瞭多種統計方法,如在遺傳力的計算上,用瞭很復雜的回歸和方差分量分析的方法。

  數理統計方法在工業中的應用,有兩個主要方面。一是在工業生產中,常有試制新產品和改進老產品、改革工藝流程、使用代用原材料和尋求適當的配方等問題。影響產品質量的因素一般很多,在進行試驗時要用到各種多因素設計方法,及與之相應的統計分析方法,以判定哪些因素是重要的,哪些是次要的,並決定一組最優的生產條件。正交設計(見實驗設計法)、回歸設計與回歸分析、方差分析、多元分析等統計方法,是處理這類問題的有用工具。另一方面是,現代工業生產多有大批量和要求高可靠的特點,為保證產品質量,需要在連續的生產過程中進行工序控制,制定成批產品的抽樣驗收方案,對大批生產的元件進行壽命試驗,以估計元件的可靠性及包含大量各種元件的系統的可靠性。為解決這些問題發展瞭一些統計方法,如種種形式的質量控制圖,抽樣檢驗,可靠性統計分析,等等,它們構成統計質量管理的內容。這些方法是20世紀二三十年代開始發展起來的,幾十年來的經驗證明,它們起瞭相當大的作用。

  醫學是較早使用數理統計方法的領域之一。在防治一種疾病時,需要找出導致這種疾病的種種因素。統計方法在發現和驗證這種因素上,是一個重要工具。例如,長時期來人們懷疑肺癌的發生與吸煙有關系,這一點得到大量統計資料的證實。另一方面的應用是,通過臨床試驗,用統計分析確定一種藥物對治療其種疾病是否有用,用處多大,以及比較幾種藥物或治療方法的效力;對比試驗、列聯表、回歸分析等是這方面的常用工具。統計方法在醫學中應用之廣,可以由在關於醫藥的廣告中也常引用統計數字這樣一個現象看出。

  數理統計方法在自然科學和技術科學中的應用,有以下幾個方面:在基礎理論研究中,常常從一種觀點出發,根據初步觀察結果而提出一種學說或假說。它們是否正確,或在多大程度上正確,要訴諸大規模的實驗驗證,這裡面就有實驗的設計和數據的統計分析問題。有時,是通過統計分析發現某種規律性,然後在理論上去尋求解釋。一個著名的例子是門德爾的遺傳定律,門德爾通過豌豆試驗發現瞭這個定律,以後由很多人通過進一步的試驗,並用數理統計學中的“擬合優度檢驗法”(見假設檢驗)檢驗過。為這個定律尋求理論上的解釋,是導致“基因學說”建立的一個重要原因。在應用性的研究中,常常因為對所研究的現象的規律性認識不充分,而不能不主要依靠對實驗和觀察數據的分析,去提出解決問題的辦法。例如,統計方法用於地震、氣象和水文方面的預報,都有一定的效果。在地質勘探中,人們在一個地區的若幹個點(點的選擇也有統計上的考慮)進行觀察,對其結果用種種統計方法,如趨勢面分析、對應分析(見多元統計分析)等去進行處理,去建立某種經驗性質的規律,以用於指導找礦。數理統計方法在上述各領域中的作用很大,以致出版瞭一些闡述統計方法在這些領域中應用的專著。一般地說,無論是自然科學和技術科學,都離不開實驗觀察,都有處理數據的問題,因此也就有統計方法用武之地。例如,通過分析實驗數據而建立經驗公式,是技術科學中常用的一種方法。

  數理統計方法對社會、經濟領域也有重要的意義,從某些數理統計學較發達的國傢看,統計方法在這些領域中的應用,比它在自然科學和技術領域中的應用更早且更廣泛。

  統計方法在社會領域中應用的一個重要方面是抽樣調查,在人力物力時間不允許進行全面調查時,使用抽樣調查可以做到節省、快速,並獲得滿意的結果。有時,經過精心設計和組織的抽樣調查,其效果甚至比全面調查更好。因為,全面調查由於工作量太大,常不免產生一些人為性的錯誤。另一方面,對社會現象的研究有向定量化發展的趨勢。例如人口學,確定一個合適的人口發展動態模型,需要掌握大量的數據資料,並使用包括統計方法在內的一些科學分析方法。在經濟科學中,定量化的趨勢比其他社會科學部門更早且程度更深,如早在20世紀二三十年代,時間序列分析方法就曾用於市場預測,現在已建立瞭一門邊緣性質的學科──數量經濟學,從簡單的回歸分析方法到艱深的隨機過程統計方法,都在其中找到瞭應用。

  發展簡史 數理統計學的發展大致可分三個時期來敘述。

  20世紀以前 這個時期又可以分成兩段,大致上可以把高斯和勒讓德關於最小二乘法用於觀測數據的誤差分析的工作作為分界線,前段屬萌芽時期,總的說還沒有超出描述性統計的范圍。不過,這個時期在概率論方面有較多的發展,為以後數理統計學的建立作瞭準備。某些現在還很常用的統計方法,如直方圖方法,符號檢驗法等,在這個時期就有人使用過。T.貝葉斯在1763年發表的《論有關機遇問題的求解》對後世統計思想起瞭很大的影響。這時期的後一段可算作是數理統計學的幼年階段。其中,高斯等關於最小二乘法的工作,在20世紀初以來經過Α.Α.馬爾可夫和其他學者的發展,成為數理統計學中的一個重要方法。但是,這個時期的最重要的發展,首先在於確立瞭這樣一種觀點,即數據是來自服從一定概率分佈的總體,而統計問題就是用數據去推斷這個分佈中的未知方面。這種觀點強調瞭推斷的地位,而使統計學擺脫瞭單純描述的性質。但這種觀點也並非一下子就徹底建立起來的,由於高斯等的工作揭示瞭正態分佈的重要性(人們常稱正態分佈為高斯分佈),在相當一個時期內,學者們普遍持有這樣一種觀點,即在實際問題中遇見的幾乎所有的連續變量,都可以滿意地用正態分佈去刻畫。這正是“正態”一詞的由來與含義。這樣,連續變量的統計基本上就被看成是正態分佈的統計。這種觀點對20世紀統計的發展起瞭很大的影響,其積極的一面是關於正態分佈的統計得到瞭深入的發展,而這在應用上有很大的重要性。但也有消極的後果,如延緩瞭非參數統計的發展並使它沒有取得應有的地位。19世紀末期以來,一些學者,特別是K.皮爾森,開始認識到這種觀點的局限性。皮爾森引進瞭一個現在以他的名字命名的分佈族,它包含瞭正態分佈及現在已知的一些重要的偏態分佈。皮爾森認為,他所引進的分佈族可以概括實用上常見的分佈。統計學以後的發展並沒有沿著他所設想的路線,但他的工作仍有很大的意義。特別是,他引進瞭一種方法──矩估計法,用來估計他所引進的分佈族中的參數(見點估計),這個方法一直是一種重要的參數估計方法。

  另外,德國的大地測量學者F.赫爾梅特1875年在研究正態總體的樣本方差時,發現瞭在統計上十分重要的ⅹ2分佈。F.高爾頓等關於回歸分析的先驅性的工作,以及時間序列分析方面的一些工作,也是這個時期數理統計學發展史中的重要事件。

  20世紀初到第二次世界大戰結束 是數理統計學蓬勃發展達到成熟的時期。許多重要的基本觀點和方法,以及數理統計學的主要分支學科,都是在這個時期建立和發展起來的。這個時期的成就,包含瞭至今仍在廣泛使用的大多數統計方法,並占據瞭教科書中的主要篇幅。在其發展中,以英國統計學傢、生物學傢R.A.費希爾為代表的英國學派起瞭主導的作用。

  K.皮爾森在1900年提出瞭檢驗擬合優度的ⅹ2統計量,並證明其極限分佈(在原假設成立時)是ⅹ2分佈。這個結果是大樣本統計的先驅性工作,20世紀20年代費希爾又作瞭重要發展。

  緊接著的一項重要進展,是皮爾森的學生,英國醫生W.S.戈塞特(又譯哥色特,筆名“學生”)1908年導出瞭t分佈──正態總體下t統計量的精確分佈,開瞭小樣本理論的先河。在此以前,皮爾森成功地導出瞭一些統計量的標準差,但對統計量的抽樣分佈問題沒有多少建樹。不過,戈塞特這項成就中也有皮爾森的功勞,因為它是在t統計量的分佈屬於皮爾森分佈族的假定下導出的。

  比皮爾森略晚的費希爾(1890~1962),對現代數理統計的形成和發展作出瞭最大的貢獻。他是一些有重要理論和應用價值的統計分支和方法的開創者,其重要成就有:系統地發展瞭正態總體下種種統計量的抽樣分佈(20年代),這標志著相關、回歸分析和多元分析等分支的初步建立;建立瞭以最大似然估計為中心的點估計理論(1912~1925);與F.耶茨合作創立瞭實驗設計,並發展瞭與這種設計相適應的數據分析方法──方差分析法(20~30年代),這在實用上很重要。費希爾在統計學上另一項有影響的工作,是他引進的“信任推斷法”(見區間估計),這種方法不是基於傳統的概率思想,但對某些困難的統計問題,特別是著名的貝倫斯-費希爾問題,提供瞭簡單可行的解法。

  在數理統計學的另一個主要分支──假設檢驗的發展中,費希爾也起過重要的作用,但假設檢驗理論的系統化和深入的研究,則應歸功於原籍羅馬尼亞的美國學者J.奈曼與K.皮爾森的兒子、英國學者E.S.皮爾森。他們在1928~1938年期間發表瞭一系列文章,建立瞭假設檢驗的一種嚴格的數學理論。其要旨是把假設檢驗問題作為一個數學最優化問題來處理。在一定意義上,他們的工作是爾後瓦爾德建立的統計決策理論的先驅。奈曼對數理統計作出的另一項很重要的貢獻,是他在1934~1937年間建立的置信區間估計理論。它基於概率的頻率解釋,並與奈曼-皮爾森的假設檢驗理論有密切聯系。

  多元統計分析是數理統計學中有重要應用價值的分支。1928年以前,費希爾已經在狹義的多元分析(多元正態總體的統計分析)方面作過一些工作。1928年J.維夏特導出瞭著名的“維夏特分佈”。此後,狹義多元分析發展很快,作出重要貢獻的學者中,包括中國著名的數理統計學傢許寶聃。他在1940年前後的幾年中,對這一領域以及線性模型的統計推斷理論,都作出瞭奠基性的工作。此外,G.U.尤爾在1925~1930年間關於時間序列分析的工作中,引進瞭自回歸和序列相關等重要概念,奠定瞭這個分支現代發展的基礎。瓦爾德在第二次世界大戰期間發展瞭序貫概率比檢驗的方法,不僅在實用上有重要意義,也為戰後序貫分析的發展開瞭先聲。

  綜合起來,以上這些成就構成瞭數理統計學一幅成熟而豐富多采的圖景,確立瞭這門學科在人類文化史中的地位。前面提到的克拉默在1946年發表的著作,對這些成就的主要部分作瞭扼要的總結,宣告瞭統計學發展史上這一重要時期的結束。

  戰後時期 這一時期中,數理統計學在應用和理論兩方面繼續獲得很大的發展。在應用上,由於經濟和軍事技術的快速發展以及電子計算機的出現,使數理統計學的應用達到瞭前所未有的規模。有些需要大量計算的統計方法,在戰前限於條件而無法使用,這個障礙今日已不復存在。在戰前,即使在統計學較發達的國傢裡,統計方法的使用多少還局限在一些“點”上,如今在一些國傢中則逐步達到瞭“面”的規模。最顯著的例子是在大批生產工業產品時使用統計質量管理的方法,它對日本在戰後的經濟恢復和發展起瞭不小的作用。

  與戰前不同,戰後統計理論是沿著縱深的方向和使用更復雜的數學工具的方向發展的。在許多情況下,是把在戰前已有發端的理論引向深入與完善,顯著的表現是在大樣本理論方面。例如,最大似然估計和非參數統計的大樣本理論,在戰前隻有初步的結果,現已達到完善的地步。

  瓦爾德在1950年創立瞭統計決策理論,它從人與大自然進行博弈的觀點出發,企圖把形形色色的統計問題歸並在一個統一的模式之下,這種理論對戰後數理統計各分支的發展產生瞭程度不等的影響。它大大地改變瞭參數估計這個分支的面貌,而對假設檢驗的影響則要小一些。但是,對於用這種觀點去看待統計問題是否恰當,統計學界還存在分歧。

  在戰後數理統計的發展中,一個引人註目的現象是貝葉斯學派的崛起。如前所述,這個學派的思想可溯源於貝葉斯1763年的工作。但在戰前,雖有一些學者,例如H.傑弗裡斯,在其著作中鼓吹這一學派的思想,並對流行的、基於概率的頻率解釋的統計理論有所批評,但未能產生多大的影響。20世紀50年代以來,這個學派日益獲得瞭勢頭,原因在於:傳統的統計學發展趨於成熟並得到大量應用後,其固有的弱點開始顯露並逐漸為人們所認識。貝葉斯統計在理論上的進展以及它在應用上的方便和效益,使其觀點為更多的人所瞭解並對一些人產生吸引力。傳統學派與貝葉斯學派之間的爭論(見貝葉斯統計),其最後結局如何,要取決於它們在應用中的表現,這會影響到未來統計學的面貌。就目前情況而言,傳統學派雖然失去瞭一些陣地,但在統計學中大體上仍處於支配地位。

  電子計算機的廣泛應用,也對戰後數理統計學的發展產生不小的影響。有瞭計算機,過去一些停留在理論上的方法得以付諸實用,而這又反過來促進人們提出和解決一些理論上的問題。如在涉及數十個自變量的大型回歸問題中,有變量選擇的問題。沒有計算機,這種問題隻能停留在紙面上,而現在這種問題所涉及的計算已不難實現,人們就提出瞭很多選擇標準並進行瞭理論上的探討,這豐富瞭回歸分析這個分支的內容。通過計算機模擬,可以在實際應用中避開一些難於解決的、復雜的抽樣分佈推導問題。另外,計算機在短時間內處理大量數據的能力,使人們有可能從各個角度對數據進行透徹的分析,從其中提出更多的信息,而不必總是依賴一定的數學模型。有的學者把這方面的工作稱為“數據分析”,並認為是數理統計發展中的一個生長點。從另一面看,這在一定程度上降低瞭模型(即理論)的作用。有的學者已表現出忽視模型的傾向,它可能加劇在數理統計學的發展中理論與應用分傢的趨勢。總的說,電子計算機的廣泛應用為數理統計學提供瞭巨大的機會,也提出瞭一些很有意義的研究課題。

  

參考書目

 M.Kendall and A.Stauart,The Advanced Theory of Statistics,4th ed.,Vol.1,4th ed.,Vol.2,3rd ed.,Vol.3,Charles Griffin,London,1977,1979,1976.

 陳希孺著,《數理統計引論》,科學出版社,北京,1981。