又稱試驗設計法,數理統計學的一個分支,研究如何制定實驗方案,以提高實驗效率,縮小隨機誤差的影響,並使實驗結果能有效地進行統計分析的理論與方法。其基本思想是英國統計學傢R.A.費希爾提出的。他在羅薩姆斯蒂德試驗站任職時著重指出:在田間實驗中,由於環境條件難於嚴格控制,實驗資料必然受到偶然因素的影響,所以一開始就得承認存在誤差。這一思想是與傳統的“精密科學實驗”相對立的,在精密科學實驗中,不是從承認誤差不可避免出發,而是致力於嚴格控制實驗條件,以探求科學規律。。田間試驗的目的之一是尋求高產品種,而實驗時的土地條件,如土質、排水等都不能嚴格控制,因此,“在嚴格控制的這樣或那樣條件下,品種A比品種B多收獲若幹斤”這類結論,實際意義就不大。在現場進行的工業實驗,醫學上的藥物療效實驗等,也有類似情形。這表明,費希爾首創的實驗設計原則,是針對工農業以及技術科學實驗而設,而不是著眼於純理論性的科學實驗。實驗設計的基本思想,是減少偶然性因素的影響,使實驗數據有一個合適的數學模型,以便使用方差分析的方法對數據進行分析。費希爾於1923年與W.A.梅克齊合作發表瞭第一個實驗設計的實例,1926年提出瞭實驗設計的基本思想,1935年出版瞭他的名著《實驗設計法》,其中提出瞭實驗設計應遵循三個原則:隨機化,局部控制和重復。隨機化的目的是使實驗結果盡量避免受到主客觀系統性因素的影響而呈現偏倚性;局部控制是用劃分區組的方法,使區組內部條件盡可能一致;重復是為瞭降低隨機誤差的影響,以保證實驗結果的重現性。費希爾最早提出的設計是隨機區組法和拉丁方方法,兩者都體現瞭上述原則。

  區組設計 指將υ個處理安排在b個區組內作實驗的一種實驗設計法。所謂“處理”,是指諸如品種、工藝條件、種植方法等因素或措施。例如,要比較三個品種的優劣,則每個品種是一個處理,共有三個處理;如試驗中涉及三個品種和兩種種植方法,則每個品種與每種種植方法搭配構成一個處理,一共有3×2=6個處理。每個區組能容納的處理個數稱為該區組的大小,常以k表示。若區組i的大小kj小於υ,則區組i容納不瞭全部的處理,稱這一類設計為不完全區組設計;當kj均不小於υ時,區組可以容納全部處理,稱這一類設計為完全區組設計。

  設要比較8個不同的品種ABCDEFGH,看哪一個品種產量比較高。若一個區組是一長條地塊,將這個地塊分成8個小塊種植全部8個品種,就得一個完全區組。如共有4個這種區組,則8個品種在每個區組內的安排,要用隨機化的方法,將區組內的小塊編號,利用隨機數或抽簽方法,決定品種的位置。圖1就是一個具體的隨機區組設計。

  如果有8個區組,每個區組可以容納8個處理,這時不用隨機化而用拉丁方進行設計,也能消除區組內各小塊位置不同的影響。

  拉丁方是指將 υ個拉丁字母(每個字母代表一個處理)排成υ行υ列的方陣,使得各個字母在各行各列出現一次且隻一次。稱υ為拉丁方的階數。例如,圖2是一個5階拉丁方。若把拉丁方的行看作區組,是一塊田;把列也看作區組,是施肥量;那麼拉丁方設計不但能消除行內各小塊位置不同的影響,還能可以消除列內施肥量不同的影響。

  不完全區組設計在實際中常常遇到。一個區組可以是一塊地、一輛汽車的四個輪胎或是車間的一個班組。當處理的數目太大時,要將全部處理安排在一個區組內是有困難的,因為區組的規模太大,就不能保證區組內的均勻性。

  費希爾的合作者F.耶茨提出:將全部處理分成若幹組,每組形成一個區組,使區組大小縮小以保證區組內的均勻性。由於各個區組不包含全部處理,這種設計叫不完全區組設計。一般地,區組設計的狹義理解大都指不完全區組設計。

  不完全區組設計主要有兩類:一類是平衡不完全區組(BIB)設計,一類是部分平衡不完全區組(PBIB)設計。設b)個區組大小相等,均為k,且k<υ,若能將υ個處理安排在b)個區組內,使每個處理出現的次數r(稱為重復數)都相同,且每兩個不同處理恰好在λ個區組內相遇(稱λ為相遇數),則稱這種安排為一個BIB設計。若λ並不全一樣,而是隨著處理對的不同而分成若幹類,則稱這種情況為一個PBIB設計。某些其他設計可以看成是 BIB設計或PBIB設計的一些特殊類型。

  在BIB設計的參數υ,b),krλ之間有如下的關系:

。這些條件對 BIB設計的存在是必要的,但不是充分的。若υ= b),從而 k= r,則稱為對稱BIB設計。若υ為偶數,則 r- λ必須是一個完全平方數,否則,設計不存在。例如由於 r- λ=12-4=8不是完全平方數,不存在υ= b)=34, k= r=12, λ=4的對稱BIB設計,盡管這些參數滿足上述必要條件。

  析因設計 區組設計主要用於農業的單因素實驗,而析因設計既能用於農業實驗,又能用於工業和其他技術科學實驗,其目的是瞭解因素對某項指標的影響。例如,某項產品質量受原料、加工溫度、加工時間等因素的影響。若原料有三個產地:上海、天津和錦州,把產地作為一個因素,則它們是這個因素的3個水平。若可選的加工溫度是80℃、90℃、100℃和105℃,加工時間是5分鐘和7分鐘,則加工溫度和加工時間這兩個因素分別有4個水平和2個水平。問題是要瞭解在這些因素的不同水平組合之下,產品質量是否有顯著性差異,並進一步確定這樣一種水平組合,使產品質量最好。析因設計就是將全部因素的水平組合起來做實驗,使得既能估計各個因素的主效應,又能估計因素之間的交互作用。所謂主效應,是指同一因素各水平之間的差異;交互作用是指一個因素的效應因另一因素的水平的改變而起的變化。前例中有3個因素,它們分別有3、4、2個水平,把它們組合起來共有3×4×2=24個水平組合,稱為3×4×2型實驗。若這3個因素分別以ABC表示,則從這個實驗可以算出3個主效應ABC;3個二因素交互作用A×BA×CB×C以及一個三因素交互作用A×B×C。主效應和交互作用統稱效應,三因素或更多因素的交互作用統稱為高階交互作用。

  部分實施法 隨著因素個數和因素水平的增多,水平組合的數目急劇增加,例如,10個3水平因素的實驗總共有310=59049個水平組合,將近6萬個實驗要全部進行是不可能的。1946年,英國統計學傢D.J.芬尼在保證能估計全部主效應和少數一部分低階交互作用的前提下,提出瞭部分實施法,即隻挑選一部分水平組合做實驗,忽略一部分低階和全部高階交互作用。正交表是進行部分實施法最方便的一種工具。

  正交表 正交陣列的簡稱,是在拉丁方和正交拉丁方的基礎上形成的。它的形式和廣泛應用同日本統計學傢田口玄一的工作分不開,他的工作得到國際上的重視,在中國也有相當影響。表

是正交表的一個例子,這個表記作 L 8( 2 7),表示有8行7列,而每行都包含2個水平,它可用來安排2水平的實驗。按正交表安排並進行分析的實驗稱為正交實驗。正交表有下述兩個性質:一是任一列的每個水平出現的次數相同;二是任意兩列的各種不同水平組合出現的次數相同。在實際應用中,當把因素對應於正交表各列時,各行則表示應做實驗的水平組合。由於上述兩個性質,任一因素的效應可不受其他因素幹擾。

  正交表的構作同組合數學有密切的關系,因此,有關正交表的一些理論性問題的探討是純粹數學的課題。

  

參考書目

 R.A.Fisher,The Design of Experiments,Oliver &Boyd,London,1935.

 W.G.Cochran and G.M.Cox,Experimental Designs,2nd ed.,John Wiley &Sons,New York,1957.

 田口玄一著:《実験計畫法》,第3版、上冊、下冊,丸善株式會社,東京,1976、1977。