區間估計-百科詞條

　　參數估計的一種形式。通過從總體中抽取的樣本，根據一定的正確度與精確度的要求，構造出適當的區間，以作為總體的分佈參數(或參數的函數)的真值所在範圍的估計。例如，估計一種藥品所含雜質的比率在1～2％之間；估計一種合金的斷裂強度在1000～1200千克之間，等等。在有的問題中，隻需要對未知量取值的上限或下限作出估計。如前例中，一般隻對上限感興趣，而在第二例中，則隻對下限感興趣。

　　在數理統計學中，待估計的未知量是總體分佈的參數<θ或θ的某個函數g(θ)。區間估計問題可一般地表述為：要求構造一個僅依賴於樣本X＝(x₁，x₂，…，x_n)的適當的區間[A(X)，B(X)]，一旦得到瞭樣本X的觀測值x，就把區間[A(x)，B(x)]作為θ或g(θ)的估計。至於怎樣的區間才算是“適當”，如何去構造它，則與所依據的原理和準則有關。這些原理、準則及構造區間估計的方法，便是區間估計理論的研究對象。作為參數估計的形式，區間估計與點估計是並列而又互相補充的，它與假設檢驗也有密切的聯系。

　　置信區間理論　這是1934年，由統計學傢J.奈曼所創立的一種嚴格的區間估計理論。置信系數是這個理論中最為基本的概念。

　　置信系數　奈曼以概率的頻率解釋為出發點，認為被估計的θ是一未知但確定的量，而樣本X是隨機的。區間[A(X)，B(X)]是否真包含待估計的θ，取決於所抽得的樣本X。因此，區間[A(X)，B(X)]隻能以一定的概率

包含未知的 θ。對於不同的 θ，π( θ)之值可以不同，π( θ)對不同的 θ取的最小值1-α(0＜α＜1)稱為區間[ A( X)， B( X)]的置信系數。與此相應，區間[ A( X)， B( X)]稱為 θ的一個置信區間。這個名詞在直觀上可以理解為：對於“區間[ A( X)， B( X)]包含 θ”這個推斷，可以給予一定程度的相信，其程度則由置信系數表示。

　　對θ的上、下限估計有類似的概念，以下限為例，稱A(X)為θ的一個置信下限，若一旦有瞭樣本X，就認為θ不小於A(X)，或者說，把θ估計在無窮區間[A(X)，∞)內。"θ不小於A(X)"這論斷正確的概率為

θ)。π ₁( θ)對不同的 θ取的最小值1-α(0＜α＜1)稱為置信下限 A( X)的置信系數。

　　在數理統計中，常稱不超過置信系數的任何非負數為置信水平。

　　優良性準則　置信系數1-α 反映瞭置信區間[A(X)，B(X)]的可靠程度，1-α愈大，[A(X)，B(X)]用以估計θ時，犯錯誤(即θ並不在[A(X)，B(X)]之內)的可能性愈小。但這隻是問題的一個方面。為瞭使置信區間[A(X)，B(X)]在實際問題中有用，它除瞭足夠可靠外，還應當足夠精確。比如說，估計某個人的年齡在5至95歲之間，雖十分可靠，但太不精確，因而無用。通常指定一個很小的正數α（一般，α 取0.10，0.05，0.01等值），要求置信區間[A(X)，B(X)]的置信系數不小於1-α，在這個前提下使它盡可能地精確。對於“精確”的不同的解釋，可以導致種種優良性標準。比較重要的有兩個：一是考慮區間的長度B(X)-A(X)愈小愈好。這個值與X有關，一般用其數學期望E_θ(B(X)-A(X))作為衡量置信區間[A(X)，B(X)]精確程度的指標。這個指標愈小，置信區間的精確程度就愈大。另一個是考慮置信區間[A(X)，B(X)]包含假值（指任何不等於被估計的θ的值）θ′的概率

，它愈小，[ A( X)， B( X)]作為 θ的估計的精度就愈高。

　　如果A(X)是θ的置信下限，則在保證A(X)的置信系數不小於1-α的前提下，A(X)愈大，精確程度愈高。這也可以用[A(X)，∞)包含假值θ′(θ′＜θ)的概率

來衡量，此概率愈小，置信下限 A( X)的精確程度愈高。對置信上限有類似的結果，若在某個準則下，一個置信區間（或上、下限）比其他置信區間都好，則稱它為在這個準則下是一致最優的。例如，在上述準則下，置信系數1-α的一致最優置信下限 A( X)定義為： A( X)有置信系數1-α，且對任何有置信系數1-α的置信下限 A ₁( X)，當 θ′＜ θ時，成立

　　有時，對所考慮的置信區間（或上、下限）加上某種一般性限制，在這個前提下尋找最優者。無偏性是經常用的限制之一，如果一個置信區間（上、下限）包含真值θ的概率，總不小於包含任何假值θ′的概率，則稱該置信區間（上、下限）是無偏的。同變性（見統計決策理論）也是一個常用的限制。

　　求置信區間的方法　最常用的求置信區間及置信上、下限的方法有以下幾種。

　　一種是利用已知的抽樣分佈(見統計量)。例如，設x₁，x₂，…，x_n為正態總體N(μ，σ²)（見正態分佈）中抽出的樣本，要作μ的區間估計，記

，

則

服從自由度為 n-1的 t分佈。指定α>0，找這個分佈的上α/2分位數 t _α _/2( n-1)，則有

即

\ n

由此得到 μ的一個置信系數為1-α 的置信區間

。類似地可以定出 μ的置信系數為1-α的置信上、下限分別為

。

　　另一種是利用區間估計與假設檢驗的聯系，設要作θ的置信系數為1－α 的區間估計，對於任意的θ₀，考慮原假設為H：θ＝θ₀，備擇假設為K：θ≠θ₀。設有一水平為α 的檢驗，它當樣本X屬於集合A(θ₀)時接受H。若集合{θ₀∶X∈A(θ₀)}是一個區間，則它就是θ的一個置信區間，其置信系數為1-α。就上例而言，對假設H：μ＝μ₀的檢驗常用t檢驗：當

時接受 μ＝ μ ₀，集合

即為區間

這正是前面定出的 μ的置信區間。若要求 θ的置信下限（或上限），則取原假設為 θ≤ θ ₀（或 θ≥ θ ₀），備擇假設為 θ＞ θ ₀（或 θ＜ θ ₀），按照同樣的方法可得到所要求的置信下（上）限。

　　還有一種方法是利用大樣本理論（見大樣本統計）。例如，設x₁，x₂，…，x_n為抽自參數為p的二點分佈（見概率分佈）的樣本，當n→∞時，

依分佈收斂（見概率論中的收斂）於標準正態分佈 N(0，1)，以 u _α _/2記 N(0，1)的上 α/2 分位數，則有

。所以，

可作為 p的一個區間估計，上面的極限值1－α就定義為它的漸近置信系數。

　　費希爾的信任推斷法　20世紀30年代初期，統計學傢R.A.費希爾提出瞭一種構造區間估計的方法，他稱之為信任推斷法。其基本觀點是：設要作θ的區間估計，在抽樣得到樣本X以前，對θ一無所知，樣本X透露瞭θ的一些信息，據此可以對θ取各種值給予各種不同的“信任程度”，而這可用於對θ作區間估計。例如，設X是從正態總體N(θ，1)中抽出的樣本，則

服從標準正態分佈 N(0，1)，由此可知，對任何 α＜ b)有

即

費希爾把這個等式解釋為：在抽樣以前，對於 θ落在區間

內的可能性本來一無所知，通過抽樣，獲得瞭上述數值，它表達瞭統計工作者對這個區間的"信任程度"，若取 b)=- α= u _α _/2，則得到區間

，其信任程度為1-α。即當用上述區間作為 θ的區間估計時，對於“它能包含被估計的 θ”這一點可給予信任的程度為1-α。

　　在本例以及其他某些簡單問題中，用費希爾的方法與用奈曼的方法得出一致的結果。但是，這兩個方法不僅在基本觀點上不一致，而且在較復雜的問題中，所得出的結果也不同。一個著名的例子是所謂的費希爾－貝倫斯問題：設兩個正態分佈

μ ₁， μ ₂， σ ₁ ²， σ ₂ ²都未知，要求 μ ₁- μ ₂的區間估計。費希爾用他的方法提供瞭一個與奈曼理論不一致的解法，奈曼在1941年曾對此進行瞭詳盡的討論。

　　另外，貝葉斯方法（見貝葉斯統計）也是一個重要的構造區間估計的方法。統計決策理論中引進的一些概念和優良性準則，也可用於區間估計。此外序貫方法(見序貫分析)在區間估計中也有瞭相當的發展。

　　區域估計　有時要對兩個或更多的參數θ＝(θ₁，θ₂，…，θ_k)(k＞1)，例如正態分佈N(μ，σ²)中的μ與σ²，同時進行估計；這時，每當有樣本X，就由X在θ的取值的k維空間R^k內定出一個區域Q(X)，而把θ估計在Q(X)內。這種估計叫做區域估計。所用區域一般為比較簡單的幾何形狀，如長方體、球或橢球等。關於區域估計的置信系數、優良性準則及其求法等，與區間估計情況相似。

　　容忍限與容忍區間　這是一個與區間估計有密切聯系的概念，但處理的問題不同。給定β，у，0＜β＜1，0＜y＜1，以F記總體分佈。若T(X)為一統計量，滿足條件

，則稱 T( X)為總體分佈 F的上（ β，у）容忍限。類似地可定義下( β，у)容忍限。若 T ₁( X)和 T ₂( X)為兩個統計量， T ₁( X)≤ T ₂( X)，且

，則稱[ T ₁( X)， T ₂( X)]為總體分佈的一個( β，у)容忍區間。例如， X是某產品的質量指標，而 F為其分佈，則( β，у)容忍區間[ T ₁( X)， T ₂( X)]的意義是：至少有1- β的把握斷言“至少有100(1-у)％的產品，其質量指標落在區間[ T ₁( X)， T ₂( X)]之內”。可以說，容忍區間估計的是總體分佈的概率集中在何處，而非總體分佈參數。

參考書目

　J.Neyman，Outline of a Theory of Statistical Estimation Based on the Classical Theory of Probability，Philosophical Transactions of the Royɑl Society，Vol.236，1937.

　陳希孺著，《數理統計引論》，科學出版社，北京，1981。