參數估計的一種形式。通過從總體中抽取的樣本,根據一定的正確度與精確度的要求,構造出適當的區間,以作為總體的分佈參數(或參數的函數)的真值所在範圍的估計。例如,估計一種藥品所含雜質的比率在1~2%之間;估計一種合金的斷裂強度在1000~1200千克之間,等等。在有的問題中,隻需要對未知量取值的上限或下限作出估計。如前例中,一般隻對上限感興趣,而在第二例中,則隻對下限感興趣。
在數理統計學中,待估計的未知量是總體分佈的參數<θ或θ的某個函數g(θ)。區間估計問題可一般地表述為:要求構造一個僅依賴於樣本X=(x1,x2,…,xn)的適當的區間[A(X),B(X)],一旦得到瞭樣本X的觀測值x,就把區間[A(x),B(x)]作為θ或g(θ)的估計。至於怎樣的區間才算是“適當”,如何去構造它,則與所依據的原理和準則有關。這些原理、準則及構造區間估計的方法,便是區間估計理論的研究對象。作為參數估計的形式,區間估計與點估計是並列而又互相補充的,它與假設檢驗也有密切的聯系。
置信區間理論 這是1934年,由統計學傢J.奈曼所創立的一種嚴格的區間估計理論。置信系數是這個理論中最為基本的概念。
置信系數 奈曼以概率的頻率解釋為出發點,認為被估計的θ是一未知但確定的量,而樣本X是隨機的。區間[A(X),B(X)]是否真包含待估計的θ,取決於所抽得的樣本X。因此,區間[A(X),B(X)]隻能以一定的概率
![](/img3/8625.gif)
對θ的上、下限估計有類似的概念,以下限為例,稱A(X)為θ的一個置信下限,若一旦有瞭樣本X,就認為θ不小於A(X),或者說,把θ估計在無窮區間[A(X),∞)內。"θ不小於A(X)"這論斷正確的概率為
![](/img3/8626.gif)
![](/img3/8627.gif)
在數理統計中,常稱不超過置信系數的任何非負數為置信水平。
優良性準則 置信系數1-α 反映瞭置信區間[A(X),B(X)]的可靠程度,1-α愈大,[A(X),B(X)]用以估計θ時,犯錯誤(即θ並不在[A(X),B(X)]之內)的可能性愈小。但這隻是問題的一個方面。為瞭使置信區間[A(X),B(X)]在實際問題中有用,它除瞭足夠可靠外,還應當足夠精確。比如說,估計某個人的年齡在5至95歲之間,雖十分可靠,但太不精確,因而無用。通常指定一個很小的正數α(一般,α 取0.10,0.05,0.01等值),要求置信區間[A(X),B(X)]的置信系數不小於1-α,在這個前提下使它盡可能地精確。對於“精確”的不同的解釋,可以導致種種優良性標準。比較重要的有兩個:一是考慮區間的長度B(X)-A(X)愈小愈好。這個值與X有關,一般用其數學期望Eθ(B(X)-A(X))作為衡量置信區間[A(X),B(X)]精確程度的指標。這個指標愈小,置信區間的精確程度就愈大。另一個是考慮置信區間[A(X),B(X)]包含假值(指任何不等於被估計的θ的值)θ′的概率
![](/img3/8628.gif)
![](/img3/8629.gif)
如果A(X)是θ的置信下限,則在保證A(X)的置信系數不小於1-α的前提下,A(X)愈大,精確程度愈高。這也可以用[A(X),∞)包含假值θ′(θ′<θ)的概率
![](/img3/8628.gif)
![](/img3/8630.gif)
![](/img3/8631.gif)
有時,對所考慮的置信區間(或上、下限)加上某種一般性限制,在這個前提下尋找最優者。無偏性是經常用的限制之一,如果一個置信區間(上、下限)包含真值θ的概率,總不小於包含任何假值θ′的概率,則稱該置信區間(上、下限)是無偏的。同變性(見統計決策理論)也是一個常用的限制。
求置信區間的方法 最常用的求置信區間及置信上、下限的方法有以下幾種。
一種是利用已知的抽樣分佈(見統計量)。例如,設x1,x2,…,xn為正態總體N(μ,σ2)(見正態分佈)中抽出的樣本,要作μ的區間估計,記
![](/img3/8632.gif)
![](/img3/8633.gif)
![](/img3/8634.gif)
![](/img3/8635.gif)
![](/img3/8636.gif)
![](/img3/8637.gif)
![](/img3/8638.gif)
![](/img3/8639.gif)
![](/img3/8640.gif)
![](/img3/8641.gif)
![](/img3/8642.gif)
另一種是利用區間估計與假設檢驗的聯系,設要作θ的置信系數為1-α 的區間估計,對於任意的θ0,考慮原假設為H:θ=θ0,備擇假設為K:θ≠θ0。設有一水平為α 的檢驗,它當樣本X屬於集合A(θ0)時接受H。若集合{θ0∶X∈A(θ0)}是一個區間,則它就是θ的一個置信區間,其置信系數為1-α。就上例而言,對假設H:μ=μ0的檢驗常用t檢驗:當
![](/img3/8643.gif)
![](/img3/8644.gif)
![](/img3/8645.gif)
還有一種方法是利用大樣本理論(見大樣本統計)。例如,設x1,x2,…,xn為抽自參數為p的二點分佈(見概率分佈)的樣本,當n→∞時,
![](/img3/8646.gif)
![](/img3/8647.gif)
![](/img3/8648.gif)
![](/img3/8649.gif)
費希爾的信任推斷法 20世紀30年代初期,統計學傢R.A.費希爾提出瞭一種構造區間估計的方法,他稱之為信任推斷法。其基本觀點是:設要作θ的區間估計,在抽樣得到樣本X以前,對θ一無所知,樣本X透露瞭θ的一些信息,據此可以對θ取各種值給予各種不同的“信任程度”,而這可用於對θ作區間估計。例如,設X是從正態總體N(θ,1)中抽出的樣本,則
![](/img3/8650.gif)
![](/img3/8651.gif)
![](/img3/8652.gif)
![](/img3/8653.gif)
![](/img3/8654.gif)
![](/img3/8687.gif)
在本例以及其他某些簡單問題中,用費希爾的方法與用奈曼的方法得出一致的結果。但是,這兩個方法不僅在基本觀點上不一致,而且在較復雜的問題中,所得出的結果也不同。一個著名的例子是所謂的費希爾-貝倫斯問題:設兩個正態分佈
![](/img3/8688.gif)
另外,貝葉斯方法(見貝葉斯統計)也是一個重要的構造區間估計的方法。統計決策理論中引進的一些概念和優良性準則,也可用於區間估計。此外序貫方法(見序貫分析)在區間估計中也有瞭相當的發展。
區域估計 有時要對兩個或更多的參數θ=(θ1,θ2,…,θk)(k>1),例如正態分佈N(μ,σ2)中的μ與σ2,同時進行估計;這時,每當有樣本X,就由X在θ的取值的k維空間Rk內定出一個區域Q(X),而把θ估計在Q(X)內。這種估計叫做區域估計。所用區域一般為比較簡單的幾何形狀,如長方體、球或橢球等。關於區域估計的置信系數、優良性準則及其求法等,與區間估計情況相似。
容忍限與容忍區間 這是一個與區間估計有密切聯系的概念,但處理的問題不同。給定β,у,0<β<1,0<y<1,以F記總體分佈。若T(X)為一統計量,滿足條件
![](/img3/8689.gif)
![](/img3/8690.gif)
![](/img3/8691.gif)
![](/img3/8692.gif)
![](/img3/8693.gif)
參考書目
J.Neyman,Outline of a Theory of Statistical Estimation Based on the Classical Theory of Probability,Philosophical Transactions of the Royɑl Society,Vol.236,1937.
陳希孺著,《數理統計引論》,科學出版社,北京,1981。