根據觀測對隨機過程進行統計推斷的理論與方法。把觀測所獲得的資料記為{xnn=0,1,2,…}或{xtt≥0},它是從一個隨機過程抽得的樣本。為瞭得到描述這一隨機過程變化的統計規律,必須對它的分佈(見概概率分佈)或某些特征作出推斷。例如檢驗它是否為某種特殊的隨機過程,估計其分佈中的某些參數等等。這些都屬於隨機過程的統計問題。

  早在數理統計學發展的初期,人們就已對隨時間推進的觀測結果運用各種統計分析方法來研究,例如,根據天文資料尋找其變化的隱蔽周期。但當時的研究還隻是限於相互獨立觀測的情形。20世紀30年代,由於描述社會或市場上某些經濟指標變化的需要,必須對不獨立的觀測結果{xn}進行分析。例如,考慮如何尋找一個自回歸模型

來近似地擬合數據{ x n},但仍限於討論離散時間觀測的情形。40年代以後,一方面由於無線電技術中信號檢測與信號參數估計的需要,提出瞭許多有關連續觀測隨機過程的統計問題。另一方面,隨機過程理論的迅速發展,也為研究上述問題提供瞭手段。1951年U.格裡南德明確提出瞭隨機過程的統計推斷這一課題,並指出數理統計中的最大似然估計(見 點估計)、似然比檢驗(見 假設檢驗)等方法原則上也可用於隨機過程的統計推斷,但一個關鍵問題是,要給出隨機過程的不同概率分佈之間相互絕對連續與奇異的條件,以及求出概率分佈間的密度。由於過程統計的需要,這一問題在以後引起瞭相當大的重視和大量的工作,對於各類重要的過程,如正態過程(見 隨機過程)、 獨立增量過程、擴散過程(見 馬爾可夫過程)、 點過程乃至一般的半鞅(見 鞅),都先後討論瞭這一問題。在分佈間具有密度的條件下,就可直接沿用數理統計的做法,這已成為過程統計中很重要的一方面。另外,過程統計也仿照數理統計中處理 線性統計模型的方法。例如,可以假定觀測結果表為非隨機變化項和一個寬平穩過程之和,利用其二階或四階矩特征,可對過程本身的均值(見 數學期望)及協方差(見 矩)作出統計推斷。由於這類統計方法要求較寬,便於應用,所以發展迅速且應用廣泛。

  依賴於密度的統計方法 設x={x(t),0≤tT}為隨機過程、{pθθ

}是 x樣本空間上的可能概率分佈族, θ是未知參數。對於兩個概率分佈 p 0p 1,如果 p 0概率為0的事件,其 p 1概率必為0,則稱 p 1關於 p 0是絕對連續的;如果存在 p 0概率為0而 p 1概率為1的事件,則稱 p 1p 0是相互奇異的。對隨機過程來說,{ p θθ }中的不同概率分佈之間往往並不相互絕對連續,有時甚至是相互奇異的。因此,首先必須討論 p θ之間的絕對連續性與奇異性問題。而後在絕對連續的情形,可以取某個 為標準,根據 測度論的拉東-尼科迪姆定理,求得其他概率分佈 p θ關於 p 0的密度 (又叫做似然比)。在這個基礎上,數理統計中的最大似然估計法,似然比檢驗法、貝葉斯推斷等,都可直接用於隨機過程的統計推斷,而一些 大樣本統計問題也可歸結為 隨機過程的極限定理來處理。

  關於隨機過程概率分佈間的絕對連續性與奇異性及其密度的問題,可利用鞅收斂定理證明如下的一般結果:若隨機連續的過程{x(t),0≤tT}在樣本空間上的可能概率分佈為p0p1,{tnn≥1}為[0,T]中的可列稠集。對x作有限次觀測{x(t1),x(t2),…,x(tn)},其相應的有限維分佈為p

p 。若 p 關於 p 絕對連續,則極限 p 0p 1都以概率1存在,且 p 1關於 p 0絕對連續的充分必要條件是 p 1( f <∞)=1,這時有 p 1p 0奇異的充分必要條件是 p 0( f =0)=1,或等價地 p 1( f =∞)=1。對各類具體過程,還要用過程本身的特征,把這一結果具體化。

  對於正態過程,其分佈間的絕對連續性問題的討論開始最早。1958年J.哈耶克和J.費爾德曼獨立地證明瞭:對具有不同協方差函數和均值函數的正態過程,其概率分佈之間或者相互絕對連續,或者相互奇異,並用不同方式給出瞭各自成立的條件。特別,若{xnn≥1}為相互獨立的正態隨機變量序列,在p0p1下,xn的概率分佈分別為

,則 p 0p 1相互絕對連續的充分必要條件是 σ σ 同時為零或同時不為零,且

這時

以後,還對許多具體的正態過程,給出瞭它們的概率分佈相互絕對連續時其均值函數和協方差函數所應滿足的條件及其密度的泛函形式。在信號檢測理論中,就是直接運用這些結果,獲得檢驗信號有無的方法和信號參數的各種估計量的。

  對於馬爾可夫鏈(見馬爾可夫過程),往往可以利用轉移概率或Q矩陣直接寫出其分佈密度及似然函數。這時,對於轉移概率、Q矩陣或概率分佈中的未知參數,就可運用最大似然估計法或似然比檢驗進行推斷。例如設{x(t),0≤tT}為生滅過程,x(0)=1,λμ分別表示其生滅強度。若以B(t)、D(t)分別表示x在[0,t]中生殖和死亡的總數,記

則觀測到樣本{ x( t),0≤ tT}後,其似然函數為

由此容易得出 λμ的最大似然估計分別為

利用 B( t)、 D( t)、 S( t)的漸近性質,還可以得出 的相合性及其漸近分佈。類似的做法還可用於更一般的點過程。

  對於狀態連續的馬爾可夫過程,討論得較多的是由隨機微分方程

規定的擴散方程,其中 W為 佈朗運動。例如,設過程 x 1x 2分別滿足方程 i=1,2; p j表示 x j的概率分佈。若 α j滿足方程存在惟一解的條件,且以概率1成立 p 2p 1相互絕對連續,且

上式右端第一項為關於半鞅 x 1的 隨機積分。利用這一結果,可以解決下列過程的參數估計問題:若 p θ表示

的解的分佈,則

因此, θ的充分統計量,而 便是 θ的最大似然估計。進而還可以推出 的相合性與漸近正態性。

  關於過程概率分佈間的絕對連續性問題,對獨立增量過程也有較完善的討論。70年代後,鞅論方法已用於對這一問題的討論,且對半鞅也給出瞭概率分佈間絕對連續的條件及密度的泛函形式。這些都為過程統計的發展開辟瞭道路。

  不依賴於密度的統計方法 在許多實際問題的模型中,常把被觀測的隨機過程記為Z(t)=m(t)+x(t),其中非隨機項

反映Z( t)的趨勢變化或周期變化部分,αυ, θ是未知參數,均值為零的隨機過程 x( t)往往表示觀測受到的幹擾和誤差。在這類模型中,往往隻須對Z( t)的部分統計特征進行推斷。采用的方法可以不必求出概率分佈間的密度,僅須對X的二階矩或前四階矩附加某些要求,一般是假定 x的二階或前四階矩為平穩的。

  對Z的統計分析常考慮下列問題:回歸系數αυ的估計,均值函數中其他參數θ(例如隱蔽周期)的估計,x的統計特征(包括協方差函數、譜密度等)的估計及有限參數模型擬合等(見時間序列分析)。

  過程統計從其任務來看,本質上與數理統計是一致的。但過程統計處理的不獨立隨機變量的統計問題遠較獨立隨機變量的相應問題來得復雜。過程統計的各種方法及其論證,更多地用到隨機過程論的許多成果。隨著隨機過程應用領域的擴大和理論研究的深入,各種過程統計方法也愈廣泛地被采用,其理論也將日趨完善。

  

參考書目

 I.V.Basawa and B.L.S.Prakasa Rao,Statistical lnference for Stochastic Processes,Academic Press,New York,1980.

U.Grenander,Abstract lnference,John Wiley &Sons,New York,1981.