分析化學測定的全過程都離不開物理量的測量,例如稱量,量體積,讀取電位、吸光度或峰高等信號值。這些測量技術對於環境溫度、濕度、試劑純度、儀器性能甚至個人的習慣等一系列因素都會在一定程度上產生敏感,從而造成測量資料的波動。實驗誤差是客觀存在的,分析結果必然帶有不確定性。為處理這些波動的資料並恰當地定量描述帶有不確定度的結果,就要用專門研究起伏波動的統計學工具,後者是建立在概率論基礎上的,可以幫助實驗者科學地收集、整理和分析資料,從中獲得資訊,並合理表達資料,以以說明研究對象的某些特征。

  誤差 測量值x帶有誤差E,測量值去掉誤差就等於真值μμx-E,所以誤差的定義為:Ex-μ,即測量值偏離真值的程度,也是測量值的不確定度。

  絕對誤差 測量值大於真值時誤差為正數,表示結果偏高;反之,誤差為負數時表示結果偏低。這裡的誤差都是絕對誤差,它具有與測量值和真值相對的量綱,也隻有在與測量值一同考慮時才有意義。例如,0.05%的絕對誤差,對於大約含矽60%的矽酸鹽中矽的測定是令人滿意的,但是發生在含量僅0.01%的痕量組分分析時,就不容許瞭。

  相對誤差 絕對誤差在真值中所占的比率稱相對誤差,一般用百分率表示:

當真值為未知時,可用多次重復測定結果的算術平均值x代替μ。相對誤差是無量綱的,以便於比較不同的分析結果。

  粗差 也稱過失誤差,是由於操作誤差而造成的。

  系統誤差 它的產生是有一定原因的,系統誤差的大小在相同的測定過程中是恒定的,或者遵循一定的規律變化,例如隨樣品量或試劑用量的大小按比例變化。系統誤差又有一定的指向,例如稱量一種吸濕性物質,稱量誤差總是正值。從系統誤差的來源看,屬於方法和技術問題,知道瞭產生的原因,便可設法消除或修正,所以也叫可定誤差。

  隨機誤差 在相同條件下重復多次測定同一物理量時,誤差的絕對值和符號的變化或大或小,或正或負,看來毫無規律和純屬偶然,這種誤差稱為隨機誤差,也叫偶然誤差。它遵循隨機變量的統計規律,單個地看是無規性的,但就其總體來說,正是由於單個的無規性,才導致瞭求它們的總和時有正負相消的機會,而且隨著變量個數的增加,誤差平均值趨近於零。這種抵償正是統計規律的表現,所以隨機誤差是可以用概率統計的方法來處理的。

  精密度和準確度 誤差代表不確定度,即不精密度和不準確度,但習慣上用其倒數來表示精密度和準確度。精密度高的實驗結果,其準確度不一定高(除非不存在系統誤差);但精密度高卻是準確度高的先決條件。

  精密度純屬隨機誤差引起的不確定度部分,它反映一組重復測定的數據相互接近的程度或說明分散的程度。在分析化學中,根據具體情況的不同,可用以下兩種方式表示精密度:①重復性,是在完全相同條件(同一操作者、同一儀器、同一實驗室和較短的時間間隔)下用相同方法分析相同的樣品所得一組重復測定數據的精密度;②再現性,是不同條件(不同分析人員、不同儀器、不同實驗室、不同時間)下用相同方法分析相同的樣品所得一組測定數據的精密度。

  準確度表征測量值與真值的偏離程度,廣義的準確度應包含系統誤差和隨機誤差的聯合效應。

  基礎統計學概念 總體、個體和樣本 統計學中把準備測量的一個滿足指定條件的個體的集合叫做總體,其中的每個單位是一個個體,從總體中隨機抽出的一組個體叫做一個樣本,樣本中個體數目即樣本的大小或樣本容量。對分析化學來說,總體是指在給定條件下經過無限多次重復測定得到的無限多個數據的集合。這隻能是理論性概念,因為實際能夠得到的是有限的N次重復測定的N個測量值,即樣本容量為N的一個樣本,通過樣本的統計量來估計總體的參數。

  正態分佈 同一個總體的無限多個數據通常總是聚集在某個中心值周圍。高於或低於中心值的數據對稱分佈在中心值兩旁。距中心值越遠的值出現的頻率越小。若以頻數對測量值作圖,可得圖1

中的鐘形曲線,曲線越寬,在指定條件下測得的數據越分散,精密度也越差,因此以反映分佈曲線寬度的參數σ(曲線拐點到中心值的橫坐標值)表征精密度,同時以反映數據集中趨勢的參數 μ表征總體平均值。確定瞭 μ和σ,分佈就確定瞭。還可用 N( μ,σ 2) 表示中心值為 μ,分散性參數為σ 2的正態分佈。

  樣本的統計量 用來估計總體參數。設在指定條件下重復測定一個化學樣品N次,以x1x2,…,xN代表N個測定值xi,便可定義下面的樣本統計量為總體參數的估值:

式中

為樣本均值, 為樣本方差, N-1為樣本的自由度。 是隨樣本而變化的隨機變量。隻有當 N趨於∞時,它們才趨近於常數,成為總體均值 μ和總體方差捛 2。方差的平方根叫做標準偏差捛:

  平均值的標準偏差 將一組獨立的重復測定值加以平均時,一部分隨機誤差得到抵償,使平均值帶有的隨機誤差比原測定值為小,N越大,抵償得越多。平均值的標準偏差σx又叫標準誤差,與單次測量值的σ之間的關系為:

故平均值服從

分佈。 N增大使σ x減小的收益,因平方根的關系而有限度。若想使標準偏差減為1/10,便要相應地使 N增大100倍,何況系統誤差並不因多次平均而減小,所以通常隻在 N<20時才考慮增大 N的收益。

  不確定度和區間估計 誤差的標準正態分佈 將測量值x的頻數分佈圖的橫坐標改成以標準偏差為單位的誤差,以變量Z表示:

Z是無量綱的,曲線上兩拐點處的橫坐標位置分別是-1和+1,而中心值為0(圖2),

這時的分佈叫標準正態分佈,以 N(0,1)表示。

  區間估計 圖2中的正態分佈曲線又叫高斯曲線,它根據高斯誤差方程畫出。

  式中p(x)dx是一個隨機誤差的值落在區間xx+dx的概率。整個曲線與橫坐標所包的面積代表全部誤差值出現的概率總和,它等於1。樣本值落入任意區間(ab)的概率記作p(axb),等於xaxb線段和曲線組成的面積,即:

經計算,樣本值落入μ-σ到μ+σ即μ±σ區間的概率為68.3%;落入μ±2σ和μ±3σ區間的概率分別為95.4%和99.7%(圖2)。

  這裡σ的系數就是N(0,1)分佈中的Z值,若取概率為0.95,即意味著Z=1.96,各種Z值下的概率可從一般書刊中查到。

  容許區間 對總體而言。μ±Zσ區間內的分佈曲線稱覆蓋域,以P表示,是由Z值規定的。在有限次測定中用樣本值xS代替總體參數μ和σ時,由於xS是隨樣本而異的隨機變量,致使選定K值組成的x±KS區間也是隨機的,難以定量覆蓋域。但是如果在選擇PK的同時外加一個出現這種P值的可能性或概率γ,便能用以下的形式說明問題,例如要回答欲使覆蓋域不小於P的可能性為γ,應取什麼K值。表1給出與常用Pγ相對應的K值。

表1 正態分佈容許限因子K值(雙側)

  由給定PγK值組成的樣本區間x±KPγS叫做統計容許區間。例如,從同一批產品的小包裝中隨機抽樣10個,測定其中某組分的含量,得x=15.32%和S=0.24%,欲以90%的把握估準至少為99%的產品的含量,可以從表1查出γ=0.90,P=0.99,N=10時的K值為3.959,由此計算得到容許區間為15.32-3.959×0.24到15.32+3.959×0.24,即14.37%~16.27%。這個答案是:如果產品中某組分的含量遵守正態分佈,便能以90%的把握斷定99%的產品中該組分含量在區間14.37%~16.27%中。

  置信區間 已知單次測量值分佈的標準偏差σ,樣本容量為N的測量平均值x分佈的標準偏差

,則通過 x和不確定度 所組成的區間 能夠括入總體均值 μ的概率是由 Z值決定的,例如:

  這裡的概率叫做置信概率或置信水平、置信度。以一定置信水平估計出的μ所在的區間叫置信區間。當總體σ為未知而用樣本S代替 σ確定置信區間時,隻有一個置信度就不夠瞭,而要用一個不但隨置信水平而異的,還要隨自由度fN-1變化的因子代替Z

  這個置信因子已由W.S.戈塞特解決瞭,他把置信因子t定義為:

  通過服從正態分佈的樣本去估計總體均值的置信區間為:

t值可從表2查到。必須註意,自由度f=∞時,各置信概率下的t值即恒等於標準正態分佈中的Z值。

表2 置信因子分佈表(雙側)

  統計檢驗 基本概念 統計檢驗是建立在小概率事件的實際不可能性原理上的概念。分析一個化學樣品和測定某物質的“真實”含量也隻能在某種置信水平Pc上用一個置信區間來推斷總體均值的所在范圍。實際上是承認另外那部分小概率1-Pc已小到足以判斷真值不會在置信區間以外。

  顯著性檢驗 在實際應用中往往不隻是估計總體的值,還需要說明總體的某種性質,例如兩個樣本的差異是否顯著到不能代表同一總體。這裡包括工藝改變後產品質量有無顯著變化,兩種分析方法測定結果是否一致等具體問題。

  這類統計推斷都是先提假設,然後按照某種邏輯在某種概率上判斷是否有顯著性差異,以決定原假設的成立與否。所以,統計檢驗方法又叫做顯著性檢驗或假設檢驗。

  顯著性水平 顯著性檢驗離不開預設的小概率,例如正態分佈的測量值落到區間[μ±2σ]以外的概率小於0.05,落到區間[μ±3σ]以外的概率更小於0.01。在N趨近於∞時,概率如此小的事件在有限次測量中理應不出現。如果竟然出現瞭,就有理由認為它是異常的。這個小概率越小,相應的事件就越顯得異常,所以此小概率在統計檢驗中叫做顯著性水平α,可用它來反映顯著異常的程度。通常α在0.05以下便認為是顯著。

  統計檢驗在分析化學中的應用 ①極值的取舍,在同一組樣本值中的最大值xmax和最小值xmin叫極值。對極值容易產生懷疑。它的取舍往往很影響精密度。如果技術上找不到舍棄的原因而又有懷疑時,可借助統計檢驗工具。先假設被檢值不異常,選定顯著性水平α(例如α=0.05)和一種判據公式,例如格拉佈斯檢驗公式:

式中T為格拉佈斯臨界值;xSxmaxxmin分別代表均值、標準偏差和被檢驗的極大、極小值。按公式計算T值與對應於給定樣本容量N與顯著性水平α的格拉佈斯臨界值T(Nα)(表3)進行比較,如果TT(Nα),則接受原假設,認為不異常,差異隨機波動。如果TT(Nα),則能以不屬同一總體為理由而舍棄被檢驗值,這樣做,犯錯誤的概率小於0.05。

表3 格拉佈斯臨界值

  ②t檢驗,指檢驗兩個樣本容量分別為N1N2的樣本,看均值x1x2是否有顯著差異,前提是二者的方差相同(隻有隨機波動)。

  先假設二者在顯著性水平α上無顯著差異,可視為來自同一總體,計算統計量t

t分佈表中對應於自由度fN1+N2-2的t(1-αf)值比較,如果tt(1-αf)則接受原假設,即在1-α置信度上認為兩平均值沒有差異。如果tt(1-αf),則否定原假設,認為兩平均值差異是顯著的,不能隻用隨機波動解釋,這樣判斷,犯錯誤的危險率小於α

  

參考書目

 ASTM,Committee E-11 on Statistical Methods,ASTM Manual on Presentation of Data andControl Chart Analysis,ASTM Special Technical Publication15D,1976.