一類生態學方法,即對植物群落(及其環境)的觀測資料進行數學分析以求揭示其內在的生態學規律。植物群落,不同於生物群落,隻包括一定地區內的植物,不包括動物和微生物,而在具體研究時更常集中於某些重點考察的生活型。但在植物群落分析中,特別是在排序研究中,環境因數也是主要研究內容,這所謂的環境因數也可以包括動物和微生物在內。植物群落分析方法,以從自然植物群落的統計學樣本中測取得的群落屬性與環境變化的定量資料為基礎,應用數學原理和計算技術,對大量資料進行兩種方法途徑的的綜合:一種是把每個群落抽樣單元,按其屬性的相似性或相異性,聚合或劃分為許多組群(分類單元),這稱為群落的數值分類。另一種是把每個群落抽樣實體視為點,在生境梯度或群落屬性梯度的n維坐標空間中,序化地標記出來,這稱為群落排序。數值分類和排序是定量地客觀地對群落進行分類,揭示植物群落類型及其組成種群與環境相互關系的新技術。由於電子計算機的普遍應用,這些數值方法正在迅速發展,不斷完善。

  植物群落抽樣 考察植物群落,選擇出可代表該群落整體並具有一致性的一定區限,叫做群落樣地。在樣地內,為測計群落各項屬性,如種類組成、生活型、種群數量特征、及環境因子特征可設置一定面積、形狀或數量的小區(樣方),這是常用的一種群落抽樣方法。為瞭進行植物群落分析,要采取客觀抽樣法,即概率抽樣。可以按具體情況在隨機抽樣、系統(規則)抽樣、或分層抽樣三者中擇取一種。

  樣方抽樣 樣方面積與形狀,原則上希望取最小表觀面積,最適的形狀。溫帶喬木群落最小面積一般為100~400平方米,熱帶森林更大些約1000~2000平方米;灌木群落約4~16平方米,草本群落1~4平方米,形狀多采用正方,也可視具體需要和種的分佈格局、微地貌不同,取圓形或長條。

  樣方數目多少,從統計學的要求,要有30~50個為好,如是分層抽樣,則每個層區中要有6~10個。群落性態變異大時,數目要多些,反之可以減少。

  無樣方抽樣 也叫威斯康星學派的點樣法。是在群落樣地內按隨機或規則抽樣,配置一定數目(通常是50~100個)樣點。再以點為中心,按最近單株法、最近鄰體法,隨機對法、或中點四分法,記錄每株喬木學名,測量株距(d)、胸徑(圖1),集合n次測定的株距d,計算出喬木的平均株距:

。由 可算出每株喬木占有地表的平均面積: ,β是校正系數,上述4種無樣方抽樣方法的校正系數β,依次為 β=2,β=1.87,β=0.8,β=1。從喬木單株平均面積 ,可計算單位樣地面積的喬木密度: =1/(β ) 2=1/ 。同時,在每個樣點上做灌木和草本記名小樣方,根據喬木、灌木、草本種類的分佈,可計算各個種的頻度。

  樣方抽樣和中心點抽樣,分別適合於不同的對象、地區和目的。平坦地區的大面積森林適合用中心點取樣,陡峭的山區森林適合用樣方抽樣。森林草地與荒漠植被則兩種抽樣都可適用。

  原始數據的處理 抽樣調查取得的各項群落屬性的觀測數據,由於屬性的數據類型不同,量綱不一,數值大小懸殊,而各種分析方法對原始數據又各有一定要求,所以對原始數據要進行適當處理。首先要求類型統一,即把二元數據轉化成數量數據,或者反之,因多數方法隻適合於分析同一類型的數據。其次,要對原始數據的數值進行轉換,即將原來數值x,轉換成

(隻取正根),或其對數、倒數,或角度、概率等,以求更合理地體現它們的數量關系,使其具有一定的分佈形式(如正態分佈),或一定的數據結構(如線性結構)。第三,將原始數據標準化或中心化。原始數據的標準化,即用屬性或實體的總和、或最大值、或極差、或模來除該屬性的某個數據,實際上是把某個數值標準化為屬性總和的比值,取值在0與1之間。例如群落分析中將種群絕對多度換算為相對多度。樣方數據經標準化後,其幾何意義是各樣方點都從原來位置沿徑向投影到單位弦上,成為線性序列(圖2)。中心化主要是用平均值或離差來標準化各個原始數據。例如,平均值中心化是從屬性或樣方的各個原始數據中分別減去其平均值。中心化的幾何意義在使坐標原點移到樣方點的形心,由此給數值運算帶來很大方便,第四,原始數據的縮減,指去掉一些代表性不好或數據不完整的樣方,或者刪去各樣方中僅出現一次的孤種、或罕見種、或者生態學意義不大的常見種。縮減種數應當適當,不應影響研究結果。

  原始數據綜合表和數據矩陣 一般的群落調查,包括N個樣方,P個種的數據,可列成N列,P行的數據表:

樣方1

  去掉表頭,將表中數據用大括號括起來,就成瞭原始數據矩陣X,其中Xij(i=1,2,3,…,Pj=1,2,3,…,N)表示第j個樣方、第i個種的原始數據。矩陣有P行,N列,第一行是同一物種。在N個樣方中的數據,稱為行向量。矩陣中每個數據,稱為元素,其值可以是二元(定性)的,或數量(定量)的,但通常隻取一種形式。

  數值分類技術 是直接以樣地內種的分佈或種類組成的相對相似性數據為基礎的群落分類方法。兩個樣地的相對相似性數值,叫做相似系數,相似與相異在數學上是互補的概念,兩者都同樣可表述兩個樣地相似的程度。

  相似系數的計算方法雖很多,但基本上可歸為2大類:一類是計算兩個樣地的群落種類組成成分的相似或相異程度,如匹配系數,關聯系數等;另一類是計算兩個樣地中共有種的數量數據的相似或相異程度,如各種距離系數。

  匹配系數與關聯系數 依據數據矩陣中兩個列(樣地)的屬性(種)的二元數據“存在”與“不存在”,可構成2×2列聯表:

樣方2

  a是兩個樣地都存在的共有種的數目;d是都不存在的種數;b是樣方1存在、樣方2不存在的種數;c是樣方2存在、樣方1不存在的種數。據2×2列聯表,可選以下任一公式,計算兩個樣地群落的相似性。

  匹配系數的常用計算公式,有P.雅卡德(1901)的公式(1.1)和J.切卡諾夫斯基(1913)的公式(1.2),這兩個公式取值均在[0,1]的區間內。當a=0時,取值為0,表示完全相異;當aP(總的種數)時,取值為1,表示完全相似。1-相似系數=相異系數。

雅卡德匹配系數=a/(a+b+c)    (1.1)

切卡諾夫斯基匹配系數=2a/(2a+b+c)   (1.2)

  關聯系數 較常用的計算方法有尤爾(1912)的公式(2.1)和達格內利(1962)的公式(2.2),取值均在[-1,+1]的區間。最大的負關聯;取值是-1,最大的正關聯,取值為+1。

尤爾關聯系數=(ad-bc)/(ad+bc)   (2.1)

     (2.2)

  距離系數 將兩個樣方表示為屬性空間中的兩個點時,則兩樣方的相異性即可用點間的距離來表示。設樣方A和B中兩個種是xy,則A和B在以xy為坐標軸的二維空間中,可表示為A點和B點(圖3)。

  A點與B點之間的距離(d)的描述方式也很多,較常用的是佈雷-柯蒂斯(3.1)距離公式,和歐氏距離公式(3.2和3.3)。公式中所用符號都是P×N的數據矩陣X=(Xij),其中i=1,2,3,…,P個種,j=1,2,3,…,N個樣方。

  佈雷-柯蒂斯距離公式:

     (3.1)

  歐氏距離公式:包括歐氏距離(d),及其平方(d2)

  相似系數矩陣 把樣方兩個兩個一組計算的相似系數數據列成N×N的相似矩陣,叫做樣方間的相似系數矩陣

;又叫 Q矩陣。其中行和列的序號都表示樣方,其中元素 表示 j樣方和 k樣方的相似系數( jk=1,2,…, N)。

  如果以種為單元,計算兩個兩個種之間的相似系數,列成P×P的相似系數矩陣,則叫做種間的相似矩陣CP,或

。這又叫 R矩陣,其中行和列的序號都表示種。元素 表示第 h種和第 i種之間的相似系數( hi=1,2,…, P)。

  植物群落的數值分類 群落分類的基本單位是樣地(或樣方),即群落實體。群落的內涵特征描述項目,如種類組成、種的頻度、多度或顯著度等的數值,即反映實體屬性的信息。數值分類一般是按屬性的相似或相異程度,將所有樣地(或樣方)集合分成若幹個“同質的”樣地(樣方)組,使組內的成員盡可能地相似,不同組的成員盡可能地相異。即按群落所包含的各個屬性、或規定的各項屬性的變異幅度來分類。這些“同質”的樣方組,可以是等級的分類類級(如傳統分類的群叢,群屬,群目,群系等),也可以是非等級的類級(統稱為植物群落型)。通常按屬性分類,用樣方間的矩陣CN,稱為正分析,或R分析方法。但也有用屬性或種間矩陣CP的,稱為逆分析,或 Q分析方法。分類的方法程序有二大類,即聚合分類,或分劃分類。

  等級聚合的分類 根據群落樣地(樣方)彼此間的相似程度,通過逐次合並,成為不同等級的“同質”樣方組,或聚簇(Clustor)的分類方法,也叫聚簇分析。等級聚合程序最早被切卡諾夫斯基(1909)用於人類學資料的分類,以後才被波蘭生態學傢專門用於植被分類。

  群落的聚簇分析,是多元的聚合方法。因為,群落樣地或樣方的N×N相似(異)系數矩陣CN是進行聚合的基礎。無論哪一種相似(異)系數,其數值都是從所有屬性的數據計算而來。聚合的程序一般是:①計算樣地(樣方)的N×N相似(異)系數矩陣CN;②先從CN中找出最相似的一對樣地(方)合並為第一個聚簇;③重算(N-1)×(N-1)的相似(異)矩陣;④再從中找出與第一次合並聚簇最相似的另一個樣地,並合並出另一個聚簇;⑤依次,重復逐次合並,直到全部樣地合並為一。簡言之,即從單個樣方開始聚合,再是聚簇與單個樣方、或與另外聚簇的聚合,自下而上直到把整個樣方集合聚合為一體,結果是產生一個逐級聚合分析的枝譜圖。

  等級聚合過程中,有一個如何測算兩個聚簇之間的距離的問題。需要一個適合的測度

,表示 h聚簇到 ij聯合聚簇之間距離。通常應用的七種聚合方法是:最近鄰法;最遠鄰法;中線法;形心法;組平均法;平方和增量法;可變法等。蘭斯和威廉斯(1967)為這些計算群簇距離的不同聚合方法,建立瞭一個統一的模型。

其中 ABCA+ B均表示樣方組(群簇)。它們的樣方數分別為 n An Bn Cn A+BA+ BAB的並組,有 n = n A+ n B2 A2 B,β, γ是常數(模型系數)。

  威廉斯和蘭伯特(1966)提出的信息分析方法,用對稱信息相似系數,即以樣方組合並引起的信息增量 △I,作為AB樣方組間的相異性指標,將信息增量最小的成對群簇加以合並,其計算式為

I(AB)=I(A+B)-I(A)-IB

  等級劃分的分類 是從N個樣地(方)的集合開始,從上向下逐次分劃。即先按相似性分為二個樣方組,使組內相似性最大,組間相異性最大。接著對每個組再次分劃,最終達到一定要求的“同質”樣方組為止。

  等級分劃有單元和多元二類,現時通行的多為單元分劃方法。如關聯分析、組群分析和信息分析等方法。在群落數值分類中最常用的是關聯分析方法。

  關聯分析,是基於在某個一致的群落中不同樣方之間種類是不相關的,即二種間的關聯是隨機的,因而可把種間關系最小的一些樣方,從樣方集合中分劃出來,作為一個類級。

  關聯分析的程序是:①依據二元(種的存在與不存在)原始數據矩陣X,求出P個種的種間關聯系數矩陣CP=(Chi),(hi=1,2,…,P);②從種的關聯矩陣中找出一個與其他種關聯最大的種A,稱為臨界種或關鍵種。③在樣方集合中把含有臨界種A的樣方組(A),與不含臨界種的樣方(a)劃分開成二個子樣方組;④對(A)分別重復上面的程序,確定另一個臨界種B,按B種的有或無,從A中劃分出有B種存在的B樣方組。如此反復進行,直到在分出的子組內部種間關聯系數全都在規定的顯著水平以下,即達到劃分過程的“終止線”為止。⑤最後,也可得到等級劃分分類的樹譜圖(圖4)。

圖中橫坐標表示兩條終止線的兩個顯著水平,縱坐標表示各次分劃的 X 2/ N的臨界值和分劃的過程。每一次分劃的兩支聯結線下的植物種是該次分劃的臨界種,(+)號表示含有該臨界種的樣方組,樣方數在方框內;(-)號表示無臨界種的樣方組,樣方數記在方框內。

  現在,一般關聯分析多采用威廉斯和蘭伯特(1959,1960)的關聯系數X2,或均方關聯系數V2

V2X2/N

式中 abcdN,都是二個種的2×2列聯表中的數值。

  選用這二種關聯系數,是因為X2系數可供進行顯著性檢驗,隻有當X2值大於或等於一定的顯著水平,0.1,0.05,0.02或0.01(對應的臨界值分別為2.706,3.841,5.412或6.635)時,才承認該兩個種(種h和種i)在各該水平上是顯著關聯的。

  組群分析,是以某些特定種的存在與不存在把樣地(方)集合劃分開來。選定特定種是依據它們與另外許多種共同出現的頻度。

  等級劃分分類的多元分劃方法,有依據樣方組之間不相似性的組內平方距離的總和法;加權歐氏距離法,以及信息分析方法,不過,在等級劃分中應用多元分析並不普遍。

  植物群落的排序 是識別環境因子、種群和群落三個方面彼此之間相互聯系的一類群落分析方法。排序的理論基礎是在環境因子的梯度與植被的種群和群落屬性的連續變化具有一定的秩序性。因而,可以將群落樣地(樣方)視為點,在以因子梯度為軸的坐標空間中分別把各個點的位置定出來,從而顯示群落抽樣及其屬性(種群)的變化的抽象格局;明晰地反映群落類型物種分佈,種群特征與主導環境因子的關系。

  Л.Г.拉緬斯基(1924,1930),早在20世紀20年代就開始以環境因素如土壤肥力和土壤水分的梯度作為坐標軸,排列物種或群落的分佈。之後,R.H.惠特克(1951,1967)的梯度分析則是從環境因子、種群、群落三方面的梯度來研究植物群落特征變化的規律。

  梯度分析有二條途徑。如果是在以已知的一個或多個環境梯度為軸的坐標空間中排列群落樣地(樣方抽樣)的話,這叫做直接梯度分析。若是以從群落抽樣(樣方)的相似性或物種相關性的測定導出的抽象軸為坐標,排列出樣地或種群的變化趨向,則叫做間接梯度分析。

  直接梯度分析 是基於Л.Г.拉緬斯基(1924)對不同植物種的種群多度(密度)依從於環境條件的變化的統計學分析和表述。他認為群落生境通常隨其不同環境因子的變化而呈現連續的變異。各個植物種在對環境的需求上具有多樣性,因而,在生境的連續變化中會顯示出不同物種各自的生態學的獨特性。在以環境梯度為軸的空間裡,直接表達種群、生態群組或群落分佈模式的技術,就叫做直接梯度分析或排序。

  直接梯度分析的程序是:①沿環境因子梯度間隔取樣;②列出梯度群落表;③描繪環境梯度種群數量分佈曲線;④劃分生態組群,確定各生態組群的平均加權;⑤按以上步驟對另一環境因子進行分析,最後建立多維的復合梯度排列圖解。

  R.H.惠特克(1954,1960)建立瞭群落樣地的比較定量法,用群落相似性百分率來表示各個群落樣本(樣地)的生態距離。PS=100-0.5∑|a-b|=∑min(ab),ab是某個種在二個樣方中的重要性值。還可直接用海拔高度和地貌單元二組復合梯度為xy軸,在圖解上表述群落類型及種群分佈格局與環境梯度的關系。

  直接梯度分析技術,導致瞭種群獨特性、種群連續統和植被復合連續統等新的群落學理論的產生。

  間接梯度分析 也叫間接排序,是以自然群落樣本(樣方)的N×N相似矩陣或相異矩陣,導出抽象軸,將樣本作為點,在軸坐標空間裡定位,從而揭示群落與環境關系的一類數學方法。包括連續統分析或組成梯度分析,極點排序,主分量分析,相互平均法,位置向量排序和典范分析等不同分析方法。它是80年代在植被分析中發展最快的領域。

  極點排序 簡寫PO是廣泛應用的一項簡易有效的間接排序技術。操作程序是:

  ① 把N個群落樣本中各個種的屬性,標準化為重要值。

  ② 將成對樣本按種的重要值計算兩個樣本的相似系數,或兩者的相異系數。相似系數計算式為PS=∑min(xy),式中的 min(xy) 是共有物種在抽樣xy中的兩個最小值。相異系數計算式為PD=1-PS

  ③ 構造N×N的相似系數和相異系數矩陣(是兩個“半矩陣”)。

  ④ 建立第一排序軸(x軸)。選取矩陣中相異系數值最大的兩個樣本,設AB兩個樣本作為x軸的端點樣本。令A位於x軸的O端;則Bx軸的遠端,BA的坐標距離,即AB的相異系數值。

  ⑤ 確定其他樣本在x軸上的坐標定位,及其與x軸的偏離值。設擬定位的樣本為CCA樣對的PD值為DACB對的PD值為DBA端與B端的距離為L,則Cx軸的坐標,是COA的距離xx可根據比爾斯(1960)的公式計算:

x

Cx軸的偏離值 h,計算式為

  ⑥ 建立第二排序軸(y軸)。選取與x軸偏離值最大的一個樣本,設為DD即可定為y軸的O端,再選取一個與D的相異系數最大的一個樣本,設為EE即是y軸的另一遠端。其他樣本,也可按照⑤的方法,確定它們在y軸上的坐標。同樣,還可選取第三排序軸(z軸)。極點排序通常隻求二或三維排序坐標。

  ⑦ 排序效果檢驗。通常可按排序坐標求出各對樣本間的歐氏距離d。再把N(N-1)/2個歐氏距離,與原來各對樣本的相似系數作為二組數據,計算它們之間的相關系數r。如果r在0.9以上,即可認為排序後的樣本距離與原數據所反映的相異性是相擬合的。排序效果是令人滿意的。

  極點排序如果用P×P的屬性相似矩陣,則可以顯示種群與環境關系的秩序,還有人應用這一技術研究土壤特性的排序(蒙克,1965)。極點排序技術經過不斷修正與改進,它在多領域裡應用取得明顯效果。具有計算簡便,排序直觀,生態學意義明晰等優點。

  主分量分析 主分量分析(PCA)是一種數據分析的數學方法,其目的是使多維空間中的樣方點群投影到低維(2~3維)空間的坐標軸上,並力求獲得原始數據的信息損失最小,或保存最多的線性序列。符合這種要求的坐標軸就稱為主分量。古多爾(1954)將這種方法首先應用到群落分析。主分量分析排序的一般程序是:

  ① 對原始數據N×PX矩陣中的屬性(種的)數據中心化、標準化,使坐標原點稱到處於N個點的形心(x1x2,…,xP)處。

  ② 計算屬性(種)間的內積矩陣SSXXT=(

),( hi=1,2,…, P)。

  ③ 求出S的特征根和特征向量。S的特征根即特征多項式|SγI|=0的P個根。將特征根依大小次序排列成h1h2≥…≥hP。再由usAu的關系解出Ph相應的特征向量,並將它們依次按行排列,得到變換矩陣u

  ④ 求N個樣方的排序坐標。根據變換矩陣u,即可由YuX,計算出N個樣方點對新坐標系的P個主分量的坐標。一般隻需取各個樣方點對第一、第二或第三主分量的值γ,以便在2~3維空間裡畫出N個樣方點的直觀排序圖形。

  ⑤ 估計屬性對主分量的作用。因為主分量是原有屬性的線性組合,各個主分量本身所荷載的信息量隻是原來各屬性的綜合效應,並非原來某一屬性的作用。所以還要估計屬性(種)在其所在主分量中所占的負荷量大小,由此可瞭解各屬性對排序所起的作用大小。

  曾對內蒙古呼盟羊草草原的40個樣方、32個種的數據,進行PCA分析排序,得到二維排序圖(圖5)。在這個PCA排序中,根據13個種計算第一和第二主分量保留的信息,隻占總信息44.3%,加上第三主分量可增大到50.7%。其中第一維y1占28.4%,第二維y2占15.9%。排序的結果,將樣方分佈構成3個點集,表征因生境的差異而存在三種群落類型。在y1軸的左面和右面是與土壤水分梯度有關的AB兩個群落;在y2的上面和下面的BC兩個群落是與土壤鹽漬化梯度有關的兩個群落。對y1作用最大的種為不太耐旱的日陰菅(負荷量2.6);對y2作用大的是隻存在於半幹旱生境的柴胡(1.9)和隻分佈在鹽漬化土壤中的堿蒿(-1.81)。這3個種也就是劃分羊草草原3個群叢組的臨界種。

  相互平均分析法 也稱對應分析,是同時進行樣地或物種(實體和屬性)的交互排序技術。即對同一套原始數據,同時交互使用正分析(R分析)和逆分析(Q分析),所以也叫相互排序方法。它也是一種用迭代法求特征向量的算法,但由於同時可得到對屬性的排序,比PCA法僅隻是能獲得屬性負荷更為切合實用,更接近於梯度分析或極點排序,也更便於作出合理的生態學解釋。相互平均法的一般程序是:

  ① 計算物種與抽樣的排序坐標間的相互平均關系。

  ② 用迭代法求出第一軸上的yz

  ③ 求其他軸上的排序坐標。

  ④ 估計特征值(即相應軸的方差)γ

  ⑤ 對物種和樣本(樣方)進行排序。

  排序方法的發展,正面臨一個如何真實反映生境、物種、群落三者間的非線性關系,及其連續、隨機和不確定性等特征的問題。

  數值分類,早期或現代發展的排序,都僅僅是研究植物群落生態學的一種數學技術,它隻是手段而不是目的。重要的是如何應用生態學實際知識和理論思維,指導方法的應用並對方法的結果作出正確的判斷和解釋。

  

參考書目

 陽含熙、盧澤愚:《植物生態學的數量分類方法》,科學出版社,北京,1981。

 周紀綸:植被的多因子生態系統分析途徑,《植物生態學與地植物學叢刊》,1981。

 R.H.惠特克主編,周紀綸等譯:《植物群落分類》,科學出版社,北京,1985。

 R.H.惠特克主編,王伯蓀譯:《植物群落排序》,科學出版社,1986。