用隨機過程理論和數理統計學方法,研究亂數據序列所遵從的統計規律,以用於解決實際問題。由於在多數問題中,亂數據是依時間先後排成序列的,故稱為時間序列。它包括一般統計分析(如自相關分析、譜分析等),統計模型的建立與推斷,以及關於隨機序列的最優預測、控制和濾波等內容。經典的統計分析都假定資料序列具有獨立性,而時間序列分析則著重研究資料序列的相互依賴關係。後者實際上是對離散指標的隨機過程的統計分析,所以又可看作是隨機過程統計的一個組成部分。例如,用x(t)表示某地區第t個月的降雨量,{x(t),t=1,2,…}是一時間序列。對t=1,2,…,T,記錄到逐月的降雨量數據x(1),x(2),…,x(T),稱為長度為T的樣本序列。依此即可使用時間序列分析方法,對未來各月的雨量x(T+l)(l=1,2,…)進行預報。時間序列分析在第二次世界大戰前就已應用於經濟預測。二次大戰中和戰後,在軍事科學、空間科學和工業自動化等部門的應用更加廣泛。
就數學方法而言,平穩隨機序列(見平穩過程)的統計分析,在理論上的發展比較成熟,從而構成時間序列分析的基礎。
頻域分析 一個時間序列可看成各種周期擾動的疊加,頻域分析就是確定各周期的振動能量的分配,這種分配稱為“譜”,或“功率譜”。因此頻域分析又稱譜分析。譜分析中的一個重要統計量是
![](/img3/9005.gif)
,
稱為序列的周期圖。當序列含有確定性的周期分量時,通過
I(
ω)的極大值點尋找這些分量的周期,是譜分析的重要內容之一。在按月記錄的降雨量序列中,序列
x(
t)就可視為含有以12為周期的確定分量,所以序列
x(
t)可以表示為
![](/img3/9006.gif)
,
它的周期圖
I(
ω)在
![](/img3/9007.gif)
處有明顯的極大值。
當平穩序列的譜分佈函數F(λ)具有譜密度f(λ)(即功率譜)時,可用(2π)-1I(λ)去估計f(λ),它是f(λ)的漸近無偏估計。如欲求f(λ)的相合估計(見點估計),可用I(ω)的適當的平滑值去估計f(λ),常用的方法為譜窗估計即取f(λ)的估計帉(λ)為
![](/img3/9008.gif)
,
式中
w
t(
ω)稱為譜窗函數。譜窗估計是實際應用中的重要方法之一。譜分佈
F(
λ)本身的一種相合估計可由
I(
ω)的積分直接獲得,即
![](/img3/9009.gif)
。
研究以上各種估計量的統計性質,改進估計方法,是譜分析的重要內容。
時域分析 它的目的在於確定序列在不同時刻取值的相互依賴關系,或者說,確定序列的相關結構。這種結構是用序列的自相關函數
![](/img3/9010.gif)
0,1,…)來描述的,式中
![](/img3/9012.gif)
為序列的自協方差函數值,
m=
E
x(
t)是平穩序列的均值。常常采用下列諸式給出
m,
γ(
k),
ρ(
k)的估計:
![](/img3/9013.gif)
,
\
n
\
n
\
n
通過
![](/img3/9018.gif)
(
k)瞭解序列的相關結構,稱為自相關分析。研究它們的強、弱相合性及其漸近分佈等問題,是相關分析中的基本問題。
模型分析 20世紀70年代以來,應用最廣泛的時間序列模型是平穩自回歸-滑動平均模型(簡稱ARMA模型)。其形狀為:
式中ε(
t)是均值為零、方差為
σ
2的獨立同分佈的隨機序列;
![](/img3/9020.gif)
和
σ
2為模型的參數,它們滿足:
![](/img3/9021.gif)
對一切|
z|≤1的復數
z成立。
p和
q是模型的階數,為非負整數。特別當
q=0時,上述模型稱為自回歸模型;當
p=0時,稱為滑動平均模型。根據
x(
t)的樣本值估計這些參數和階數,就是對這種模型的統計分析的內容。對於滿足ARMA模型的平穩序列,其線性最優預測與控制等問題都有較簡捷的解決方法,尤其是自回歸模型,使用更為方便。G.U.尤爾在1925~1930年間就提出瞭平穩自回歸的概念。1943年,Η.Β.曼和Α.瓦爾德發表瞭關於這種模型的統計方法及其漸近性質的一些理論結果。一般ARMA模型的統計分析研究,則是20世紀60年代後才發展起來的。特別是關於
p,
q值的估計及其漸近理論,出現得更晚些。除ARMA模型之外,還有其他的模型分析的研究,其中以線性模型的研究較為成熟,而且都與ARMA模型分析有密切關系。
回歸分析 如果時間序列x(t)可表示為確定性分量φ(t)與隨機性分量ω(t)之和,根據樣本值x(1),x(2),…,x(T)來估計φ(t)及分析ω(t)的統計規律,屬於時間序列分析中的回歸分析問題。它與經典回歸分析不同的地方是,ω(t)一般不是獨立同分佈的,因而在此必須涉及較多的隨機過程知識。當φ(t)為有限個已知函數的未知線性組合時,即
![](/img3/9022.gif)
,
式中
ω(
t)是均值為零的平穩序列,α
1,α
2,…,α
s是未知參數,
φ
1(
t),
φ
2(
t),…,
φ
s(
t)是已知的函數,上式稱為線性回歸模型,它的統計分析已被研究得比較深入。前面敘述的降雨量一例,便可用此類模型描述。回歸分析的內容包括:當
ω(
t)的統計規律已知時,對參數α
1,α
2,…,α
s進行估計,預測
x(
T+
l)之值;當
ω(
t)的統計規律未知時,既要估計上述參數,又要對
ω(
t)進行統計分析,如譜分析、模型分析等。在這些內容中,一個重要的課題是:在相當廣泛的情況下,證明 α
1,α
2,…,α
s的最小二乘估計,與其線性最小方差無偏估計一樣,具有相合性和漸近正態分佈性質。最小二乘估計â
j(1≤
j≤s)不涉及
ω(
t)的統計相關結構,是由數據
x(1),
x(2),…,
x(
T)直接算出,由此還可得
對
![](/img3/9024.gif)
(
t)進行時間序列分析中的各種統計分析,以代替對
ω(
t)的分析。在理論上也已證明,在適當的條件下,這樣的替代具有滿意的漸近性質。由於
ω(
t)的真值不能直接量測,這些理論結果顯然有重要的實際意義。這方面的研究仍在不斷發展。
時間序列分析中的最優預測、控制與濾波等方面的內容見平穩過程條。近年來多維時間序列分析的研究有所進展,並應用到工業生產自動化及經濟分析中。此外非線性模型統計分析及非參數統計分析等方面也逐漸引起人們的註意。
參考書目
U.Grenander and M.Rosenblatt,Statistical Analysis of Stationary Time Series,John Wiley &Sons,New York,1957.
G.E.P.Box and G.M.Jenkins,Time Series Analysis,Forecasting and Control,Holden-Day,San Francisco,1970.
E.J.Hannan,Multiple Time Series,John Wiley &Sons,New York,1970.
安鴻志等著:《時間序列的分析與應用》,科學出版社,北京,1983。