方差分析-百科詞條

　　通過分析實驗資料來判斷實驗中各因素對結果有無影響或影響大小的統計學方法。英國統計學傢、遺傳學傢R.A.費希爾在1923年首先提出，最初用於農業田間實驗資料的統計分析。這一方法後來經過許多學者的發展在科學研究和工農業生產的許多領域獲得瞭廣泛應用。

　　方差分析簡單地說，就是將反映全部實驗資料在其平均值附近波動大小的“總平方和”分解成由某一因素造成的部分和由隨機誤差造成的部分（它們也用平方和的形式表示），比較這兩部分的大小，就能能判斷這一因素對實驗結果的影響如何。下面通過一個具體例子來說明方差分析的一些基本概念和處理方法。例如，進行一項用不同飼料喂養小白鼠的實驗，以判明不同飼料對小白鼠生長的影響，假設有k 種飼料，按飼料的不同將小白鼠分成k組，每組的鼠數可以相等也可以不等，第i組的鼠數為n_i(i=1，2，…，k)。試驗結果小白鼠增加的體重第i組為 x_i1，x_i2，…，x_ini(i=1，2，…，k)。全部數據的平均值為

式中 n= n ₁+ n ₂+…+ n_k為全體鼠數，

為第 i組小白鼠增加體重的平均值。上式說明，全體平均值 x是各組平均值 x ₁， x ₂，…， x _k的加權平均（權數為 n ₁／ n， n ₂/ n，…， n_k/ n）。反映全部數據對平均值 x離散程度的量

稱為變差平方和，也稱總平方和，在方差分析中通常以 SS _T記之。通過演算，可將 SS _T分解成兩部分:

　　上式說明形成總平方和SS_T的原因有兩種:一是由於各組的平均值x_i對於總平均值x的離散造成的SS₁，通常稱為解釋平方和，也稱組間平方和；另一則是純由隨機誤差造成的SS₂，通常稱為誤差平方和，也稱組內平方和。如果SS₁在SS_T中所占的份額很大，則說明不同的飼料對實驗結果影響很大；在相反的極端情形下，如果SS₁=0，即各組的平均值與總平均值重合，x₁=x₂=…=x_k=x，則SS_T將全部由隨機誤差造成。

　　因此計算SS₁/SS₂的大小，就能對飼料因素在實驗中的影響作出判斷。在統計學上通常將SS₁/SS₂稱為F 比，這個統計量在一定條件下服從F分佈。采用F比作顯著性檢驗的方法稱為F檢驗。但在求F比以前，還須對SS₁和SS₂“正規化”一下，即把它各除以自己的自由度k-1和n-k，得到的

　　 MS₁=SS₁/(k-1) MS₂=SS₂/(n-k)相應地稱為解釋平均平方和（組間平均平方和）及誤差平均平方和（組內平均平方和）。

　　上述例子隻考慮瞭一個因素（飼料的不同）的方差分析，但其基本思想可直接推廣到多因素的情況。例如，在上例中除瞭考慮飼料的因素之外，還可考慮小白鼠的不同品種。這時有兩個因素（飼料和品種）影響著小白鼠的生長。如果有k種飼料，l種品種，則實驗數據要分成kl組。為瞭要對總平方和進行平方和的分解，需要對實驗進行適當的設計，這是統計學中另一分支“實驗設計”研究的主要內容。此外多因素方差分析還要考慮兩個因素的相互影響，兩個因素影響的總的效果往往不是單個因素影響的簡單相加。這種現象在實驗設計中稱為交互作用。在單因素方差分析中不存在這種交互作用，它是多因素方差分析中特有的問題。