由統計學傢A.瓦爾德在1950年提出的一種數理統計學的理論,這種理論把數理統計問題看成是統計學傢與大自然之間的博弈;用這種觀點把各種各樣的統計問題統一起來,以對策論的觀點來研究。在此以前,人們對數理統計,主要是著眼於其推斷的功能,亦即從觀測資料出發對總體作出某種論斷(見統計推斷)。至於由此應該採取什麼決策或行動,會產生什麼後果,則被認為不屬於統計的範疇。瓦爾德的理論則把後面這一部分內容也納入統計的範圍之內,這在數理統計學上是一項革新,有較大的實際意義。

  在一個統計問題中,統計工作者掌握的資料是樣本X=(x1x2…,xn),X所來自的總體的分佈Fθ中包含的參數θ為未知,而隻知道θ所屬的集合

θ所有可能取值的集合,稱為參數空間)。但是,采取什麼決策最好,則取決於未知的 θ值。用形象化的說法, θ是由大自然在參數空間 中選定的,人們力圖去找到它。大自然掌握瞭 θ的秘密,而這個秘密又通過樣本泄露出來,統計工作者的任務就是根據樣本 X中所包含的關於 θ的信息,去作出良好的決策。例如,一傢商店根據抽樣決定是否接受一批來貨,一個工廠根據市場調查的結果決定某種產品生產多少等,希望所采取的行動取得盡可能好的效果,或者說,使“行動不當”所造成的損失盡可能小。

  統計決策三要素 可以通過三個要素把一個統計決策問題表達出來。

  ① 樣本空間 H與樣本分佈族{Fθθ

}這個要素規定瞭問題的概率模型。樣本空間是樣本可能的取值范圍,而樣本分佈族是樣本所可能遵從的分佈的集合。

  ② 行動空間A  它是統計工作者可以采取的單純策略(或稱行動)的集合。例如,設θ為一維參數,要對θ作區間估計,則實軸上任一區間[αb)]構成一個單純策略,這時行動空間為所有[αb)]構成的集合,即{[αb)]:-∞<αb<∞}。若問題是要檢驗有關θ的假設,則行動空間Aα0(接受假設)和α1(拒絕假設)兩個元素構成。

  ③ 損失函數L統計決策理論有一個基本出發點:所采取的行動的後果可以數量化。設參數真值為θ,統計工作者采取的行動為α,則所遭受的損失可表為αθ的函數L(θα),稱之為損失函數。在一個具體問題中,采取什麼損失函數最好,是一個需要進行大量調查研究以至理論工作的問題,這也是在使用決策理論時的一個困難點。

  統計決策函數 當三個要素都已給定時,統計工作者采取什麼行動,取決於他所掌握的樣本。求一個統計決策問題的解,就是制定一個規則,以便對樣本空間中每一點,在行動空間中都有一個元素與之對應,也就是找一個定義於樣本空間 H而取值於行動空間A的函數或分佈函數δ,當有瞭樣本X=x,就按δ(x)采取行動,稱δ為決策函數。用對策論的語言,δ就是統計工作者所采取的策略。

  選擇決策函數的準則 對一個統計決策問題,為選定一個較優的決策函數,需要建立反映決策函數優劣的指標。風險函數R(θδ)就是這樣的指標,定義為R(θδ)=Eθ[L(θδ(X))],即采取決策函數δ而參數真值為θ時所遭受的平均損失。風險函數愈小,決策函數愈好。在這個原則下,可以引進種種更具體且可行的準則。

  ① 容許性準則  設δ為一決策函數,若存在另一決策函數δ

,使對一切 θR( θδ )≤ R( θδ),且不等號至少在 中的某一點成立,則稱 δ為不可容許的,否則為可容許的。從風險愈小愈好的原則出發,當 δ不可容許時,便沒有理由使用它。判定一個決策函數是否可容許,是統計決策理論中一個重要而且困難的問題。在風險函數愈小愈好的原則下,若存在決策函數 δ 0,對一切 θ 必成立 R( θδ 0)≤ R( θδ),其中 δ為任一決策函數,則 δ 0是最好的決策函數,稱為一致最優決策函數。但這種決策函數一般不存在,因而不得不放寬條件,常采用的有兩種方法:一種是不對風險函數在 上作逐點比較,而采用某種綜合性指標;另一種方法是先從一定角度對允許使用的決策函數加以一定限制,然後再找一致最優的,從而又引出下列準則。

  ② 最小化最大準則 最大風險

是一種綜合性指標,若存在使最大風險最小的決策函數 δ ,使得對一切決策函數 δ都有: M( δ)≥ M( δ ),則稱 δ 是最小化最大決策函數,它反映瞭一種較穩健或保守的策略思想。

  ③ 貝葉斯準則 它以貝葉斯風險為指標,在參數空間

上選定一概率測度ξ,稱ξ為 θ( θ )的先驗分佈,而稱 為決策函數 δ的相對於ξ的貝葉斯風險,它也是一個綜合性指標。若

對一切決策函數 δ都成立,稱 δ 為ξ的貝葉斯決策函數。

  ④ 最優同變性準則 這是一種在限制決策函數有同變性的條件下,求一致最優決策函數的準則。同變性是指當問題由於平移、刻度等變換而發生變化時,相應的決策(對策)也能有同步地變換的性質。例如,在正態總體N(μ,1)中抽樣x1x2,…,xn以估計μ,若將度量原由零點(O)移到с處,則樣本在新坐標系下變為x1+с,x2+с…,xn+с,而參數變為μ+с,如果接受“估計結果不應與坐標原點的取法有關”的原則,則所用的決策δ應滿足:對任何實數с,有

;稱這樣的 δ在平移變換下有同變性。可以在樣本空間H上考慮更復雜的一一變換群,而定義在這個變換群之下的同變性,在所有具有同變性的決策函數類中,風險一致最小的決策函數被稱為最優同變決策函數。

  在點估計中,限制使用的估計量有無偏性,采用平方損失函數

,在這個限制下,一致最優估計量就是一致最小方差無偏估計。這是另一個在限制決策函數下,求一致最優策略的例子。

  一旦選定瞭優良性標準,統計決策問題的解決,就相當於一個數學上的最優化問題。1950年後的幾十年來在這方面做瞭不少工作,這不僅使統計問題有瞭嚴格的數學提法,同時也在形式上部分地突出瞭瓦爾德的想法,把形式不一樣的統計問題歸並在一個模式下統一處理。決策函數的觀點使統計更註重瞭所采取行動的效果,也使統計問題提法更加多樣化,從而開拓瞭某些新的研究領域,例如前面提到的關於容許性及最小化最大準則的研究。因此,瓦爾德的理論受到統計學界的重視,成為二次大戰後統計學史上一個重大事件。但是,在這個問題上的看法也並不一致,英國統計學傢M.肯德爾認為“損失的數量化”並非在任何情況下都合理可行,而且他還認為,把統計問題歸之於統計工作者與大自然之間的博弈的觀點,是值得懷疑的。

  

參考書目

 A.Wald,Statistical Decision Functions,John Wiley &Sons,New York,1950.

 J.O.Berge,Statistical Decision Theory,John Wiley &Sons,New York,1980.