參數估計的一種形式。目的是依據樣本X=(X1X2,…,Xn)估計總體分佈所含的未知參數θθ的函數g(θ)。一般θg(θ)是總體的某個特征值,如數學期望、方差、相關系數(見相關分析)等。θg(θ)通常取實數或k維實向量為值。點估計問題就是要構造一個隻依賴於樣本X的量ĝ(X),作為g(θ)的估計值。ĝ(X)稱為g(θ)的估計量。因為k維實向量可表為k維歐幾裡得空間的一個點,故稱這樣的估計為點估計。

  例如,設一批產品的廢品率為θ,為估計θ,從這批產品中隨機地抽出n個作檢查,以X記其中的廢品個數,用X/n估計θ,就是一個點估計。又如用樣本方差(見統計量)估計總體分佈的方差,或用樣本相關系數估計總體分佈的相關系數,都是常見的點估計。

  構造點估計的方法 常用的有以下幾種:

  矩估計法 這是英國統計學傢К.皮爾森在1894年提出的方法,其要旨是用樣本矩的函數估計總體矩的同一函數。例如,若總體分佈服從正態分佈N(μσ2),其中μ是總體均值,σ2是總體方差,未知參數可記為θ=(μσ)。σ/μ(μ≠0)稱為變異系數,它是總體的一階原點矩(即均值)μ與二階中心矩(即方差)σ2的函數。設有樣本X=(X1X2,…,Xn),其一階樣本原點矩為

,二階樣本中心矩為 ,而用 估計 σ/ μ,就是一個典型的矩估計方法。

  最大似然估計法 此法作為一種重要而普遍的點估計法,由英國統計學傢R.A.費希爾在1912年提出。後來在他1921年和1925年的工作中又加以發展。設樣本X=(X1X2,…,Xn)的分佈密度為L(Xθ),若固定X而將L視為θ的函數,則稱為似然函數,當X是簡單隨機樣本時,它等於f(X1θ)f(X2θ)…f(Xnθ),其中,f(Xθ)是總體分佈的密度函數或概率函數(見概率分佈)。一經得到樣本值x,就確定

(x),使 ,然後用 估計 g( θ),這就是 g( θ)的最大似然估計。例如,不難證明,前面為估計正態分佈 N(μ, σ 2)中的參數 μσ 2而提出的估計量 2,就是 μσ 2的最大似然估計。

  最小二乘估計法 這個重要的估計方法是由德國數學傢C.F.高斯在1799~1809年和法國數學傢A.-M.勒讓德在1806年提出,並由俄國數學傢Α.Α.馬爾可夫在1900年加以發展。它主要用於線性統計模型中的參數估計問題。

  貝葉斯估計法 是基於“貝葉斯學派”的觀點而提出的估計法(見貝葉斯統計)。

  小樣本優良性準則 可以用來估計g(θ)的估計量很多,於是產生瞭怎樣選擇一個優良估計量的問題。首先必須對“優良性”定出準則。這種準則不是惟一的,它可以根據問題的實際背景和理論上的方便進行選擇。優良性準則有兩大類:一類是小樣本準則,即在樣本大小固定時的優良性準則;另一類是大樣本準則,即在樣本大小趨於無窮時的優良性準則。最重要的小樣本優良性準則是無偏性及與此相關的一致最小方差無偏估計。若一個估計量ĝ(X)的數學期望等於被估計的g(θ),即對一切θ

,則稱 ĝ( X)為 g( θ)的無偏估計,這種估計的特點是:在多次重復使用時, ĝ( X)與 g( θ)的偏差的算術平均值隨使用次數的增加而趨於零。因此,無偏性隻在重復使用中,並且各次誤差能相互抵消時,才顯出其意義。無偏估計並不總是存在。例如,設總體服從 二項分佈 B( nθ),0< θ<1,則1/ θ的無偏估計就不存在。有時,無偏估計雖然存在,但很不合理。在一些問題中,無偏估計有很多,它們的優良性由其方差來衡量,方差愈小愈好。若一無偏估計的方差比任何別的無偏估計的方差都小,或至多相等,則稱它為一致最小方差無偏估計。尋找一致最小方差無偏估計的一個普遍方法,是D.佈萊克韋爾、E.L.萊曼和H.謝菲在1950年提出的,它基於統計量的充分性與完全性的概念:設 ĝ( X)是一個無偏估計, T是一個完全充分統計量,則 ĝ( X)在給定 T時的 條件期望就是一個一致最小方差無偏估計。

  克拉默-拉奧不等式是尋求一致最小方差無偏估計的另一重要工具,是由印度統計學傢C.R.拉奧和瑞典統計學傢H.克拉默在1945年和1946年先後獨立地證明的。當樣本的似然函數L(Xθ)滿足一定條件時,則g(θ)的任一無偏估計ĝ(X)的方差

,對於一切 θ滿足不等式 這個不等式的右邊隻與樣本的分佈及待估函數 g有關,而與 ĝ( X)無關。通常稱這個不等式為克拉默-拉奧不等式,或C-R不等式。它的右邊給出瞭 g( θ)的無偏估計的方差的最小下界,稱為克拉默-拉奧下界或C-R下界。因此,若某一無偏估計的方差達到上述C-R下界,則它必是一致最小方差無偏估計。C-R不等式在其他統計問題中也有應用。

  在點估計問題中還使用其他一些小樣本準則,如容許性準則、最小化最大準則、最優同變準則(見統計決策理論)等。

  大樣本優良性準則 重要的如下:

  相合性 若g(θ)的估計量ĝn(X1X2,…,Xn)在n趨於無窮時,在某種收斂意義下(見概率論中的收斂)收斂於g(θ),則稱ĝn(X1,…,Xn)是g(θ)的在這種收斂意義下的相合估計。這是點估計最基本的大樣本準則。例如依概率收斂意義下的相合性稱為弱相合,幾乎必然收斂意義下的相合性稱為強相合。矩估計一般具有相合性。最大似然估計在一定條件下為強相合的證明始自A.瓦爾德1949年的工作,並在以後為許多學者所發展。線性統計模型中參數的最小二乘估計的強相合性研究始於20世紀60年代,近年來取得很大的進展。

  最優漸近正態估計 簡稱BAN估計。設X1X2,…,Xn為從一總體中隨機獨立地抽出的樣本,總體分佈具有密度函數或概率函數f(xθ),滿足一定的正則條件,設g(θ)為待估函數,記

式中

稱為費希爾信息量,若 g( θ)的估計量為 ĝ n( X 1X 2,…, X n),當 n 時,

依分佈收斂於正態分佈 N(0, v 2( θ)),就稱此估計量為 g( θ)的 BAN估計。在 g( θ)的一類漸近正態估計中,以這種估計的漸近方差最小,故稱為最優漸近正態估計。在一般條件下,最大似然估計是BAN估計。

  漸近有效估計 當樣本大小為n時,C-R不等式的右邊(即C-R下界)就是v2(θ)/n。在BAN估計定義中,並未要求估計量ĝn(X1X2,…,Xn)的方差存在,如果去掉漸近正態性的要求,而要求ĝn(X1X2,…,Xn)的方差存在且漸近於C-R下界,則得到克拉默於1946年定義的漸近有效估計的概念。不少情況下,BAN估計也是漸近有效估計。1960年印度統計學傢R.R.巴哈杜爾提出另一種漸近有效性的概念,還可以用於假設檢驗問題。近年來,日本統計學傢竹內啓又在兩個方面發展瞭估計的漸近有效性概念:一是漸近分佈不必是正態分佈;二是收斂於漸近分佈的階不必是

  點估計理論是數理統計學得到較多和較深入發展的一個方面。在小樣本方面,1955年C.施坦提出瞭一個反例,證明當維數大於2時,多維正態分佈均值向量的通常估計(樣本均值)在平方損失下不可容許。這個簡單的但出乎意料的反例啟發瞭關於點估計的容許性的一系列研究。在大樣本方面,值得提到的發展還有自適應估計、穩健估計及非參數估計方面許多深入的結果。

  

參考書目

 H.克拉默著,魏宗舒等譯:《統計學數學方法》,上海科學技術出版社,上海,1966。(H.Cramér,MatheMatical Methods of Statistics,Princeton Univ.Press,Princeton,1946.)

 成平等著:《參數估計》,上海科學技術出版社,上海,1985。