又稱博弈論,研究由一些帶有相互競爭性質的個體所構成的體系的理論。一場競爭按競爭規則從開始到結束稱為局。參加競爭的個體稱為局中人,可以是某一個人,一個臨時的聯合體,一個隊,一個公司,一個政治團體,一個國傢,等等。若一局對策中有n個局中人,則稱此局為n人對策。局中的一次動作(著),是指在某一時刻要求某一局中人作出一個決定。在一局對策中,每個局中人可能有許多供選用的方案來指揮他的動作作。局中人據以選取他的方案的規則稱之為一個策略。若一種規則可以決定局中人選取何種方案,而不是決定局中人以多大的概率選取何種方案,則稱此種規則為純策略;而把按某種概率來選取方案的規則稱為混合策略。若局中人甲有m個可供選用的純策略:α1α2,…,αm,則混合策略以概率向量

記之,其中 x i是選用純策略 α i的概率,且 n個局中人對局終瞭時各有所得(可以為正,也可以為零或負),以 p i表示局中人i的所得,稱為支付,則對局的結果可用數字向量( p 1p 2,…, p n)表出。

  對策的正規形式與展開形式 一個對策的正規形式是將所給的對策化為與之等價的如下的對策:當局中人在明白瞭對策的規則之後,各自在相互不知道的情況下選取一個純策略,然後將他所選的策略告訴一個毫無偏私的公正人。利用已經知道的規則,對局結果即告確定。

  對策論中常用的另一種形式是展開形式,即依所給對策的特殊結構,按邏輯次序將所給對策寫成一個樹狀圖,每一個結點表示一次動作(步),從該點發出的樹枝表示在該次動作可供選取的方案,這種選擇可以是局中人自己決定的,也可以是依賴於某種隨機規律進行的。沒有樹枝發出的結點為一終端,可以根據對局規則在各終端、各樹枝將相應的已知信息寫出,並在各終端註上各局中人的所得。顯然,有瞭展開形式就可寫出正規形式。例如,設甲、乙二人鬥牌,共十二張牌,紅七綠五。每人先下賭註1份,然後發牌,先發甲一張,甲看後,可以放棄,也可以增加賭註3份再鬥。若甲放棄,則對局結束,此時若甲持紅牌則贏1份;若持綠牌則輸1份。倘若甲要鬥,則乙須考慮是相拼,還是認輸。若乙認輸,則甲贏1份;若乙相拼,則亮牌:甲為紅牌時甲贏4份;甲為綠牌時乙贏4份。以上過程可寫成展開式如下圖。

  顯然,甲可能采取的策略有四:不管持牌是紅是綠皆鬥(記為α1);拿紅牌時才鬥(記為α2);拿綠牌時才鬥(記為α3);不管是紅是綠皆放棄(記為α4)。乙的策略則為:相拼(記為β1)和認輸(記為β2)。於是,相應於展開式可得出正規形式:

容易算出此矩陣,例如對於 (α 3β 1),甲拿到綠牌的概率為5/12,此時乙要相拼;甲拿到紅牌的概率為7/12,此時甲放棄,甲的期望所得為和數

,此即表示甲、乙在互不知道的情況下,若甲選取的策略是 α 3(拿綠牌時才鬥),乙則選取 β 1(相拼),其結果是甲的期望所得為-13/12。

  二人零和對策 它是對策論中最簡單而結果最為完整的部分。此時n=2,p1+p2=0,即甲的所得(失)是乙的所失(得)。設甲可供選用的策略共有m種:α1α2,…,αm;乙有n種:β1β2,…,βn。當甲采用αi乙采用βi時,甲的所得為αij(乙的所得為-αij),則此對策可用矩陣

表示,並記為 A= α ij,因此又稱為矩陣對策。

  一局對策的解,是指求出“明智的”局中人所采用的最優策略以及在此策略下的所得。若甲是"明智的",則會認為當他采取策略αi時乙必采取使

的策略 ,因而當甲在考慮策略時所選取的 i 0,應使

。同理,當乙考慮策略時所選取的 j 0,應使 。容易證明,

若等號成立,則稱此局對策有一鞍點,或有一純策略解,但並不是每局對策皆有純策略解。例如關於對策 ,上式的等號不成立。

  混合策略 若甲與乙分別采取策略x與у,則其所得分別定義為

,其中 x iy j是x與у的分量。設x( Y)為所有概率向量x(у)組成的集,亦即甲(乙)的全部策略。若存在 x ∈( Xy Y,使得

X Y T A

若(x

,у )是矩陣對策 A關於混合策略的一個鞍點,則定義 x )是甲(乙)的最優策略。 x 和у 可以利用線性規劃來尋求。

  二人非零和對策 它的定義是:設n=2,且p1+p2≠0,意即甲的所得(失),並不一定就是乙的所失(得)。它與零和對策的主要差別是:對甲是好的策略,對乙不一定就是壞的。因此兩個局中人不一定全是對抗的,他們可以暴露自己的策略,使雙方同時受益。對於非零和對策,有兩種情況必須分開處理:非合作對策與合作對策。前者是指不許事先互通信息,不許結盟,不許搞聯合對策等;後者則不受此限制。

  若局中人甲的所得可表示為A=(αij),乙的所得可表示為B=(bij),AB皆為m×n矩陣,則此種對策稱為雙矩陣對策。

  非合作對策的基本理論是在納什平衡點概念的基礎上建立起來的。設存在甲的一個混合策略x

和乙的一個混合策略у ,使得對於所有混合策略x、у皆有

則( x ,у )稱為此對策的一個平衡點。可以證明,任何雙矩陣非合作對策皆有平衡點。平衡點不一定是惟一的,也不一定是使雙方的所得是最好的,例如取

容易證明{(0,1),(0,1)}是一個平衡點,它對應的所得為(1,1),但它顯然不如{(1,0),(1,0)}對應的所得( α 11b 11)=(2,2)來得好,而{(1,0),(1,0)}並不是平衡點。此時,甲、乙兩者的所得較多。因此,二人非零和對策的解必須再考慮別的因素。若兩向量x與x′滿足關系 x ix i (i=1,2,…, n),則稱x控制x′。若對二人非零和對策,存在一平衡點所對應的所得控制所有其他的平衡點對應的所得,則定義該平衡點為此對策的解,但這種點並不總是存在的。

  n人對策 對於非合作對策來說,n人對策與二人對策在處理方法上沒有本質的差別,但對於合作對策來說,其差異則很大。這主要是由於通過合作可以組成若幹集團,而其重點則在於結合的方式。

  特征函數是用來研究合作對策的基本概念之一。它是一個實值集函數v(S),這裡SN={1,2,…,n}的一子集。v(S)應滿足下列條件:①v(ø)=0,ø表示空集。②v(ST)≥v(S)+v(T),對於所有滿足ST=ø的N的子集ST皆成立。N中的元素表示局中人,N的子集表示集團。條件②保證合作比不合作優越。合作對策的另一個基本概念是分配。所謂分配,是指具有下述性質的向量

:對於所有的i∈ Nx iv({i}); ,即必須保證每一入夥的人,通過加入集團所得不低於單幹所得。設x與у是兩個分配,若對於任一 SN ,且 x iy i,對所有的i∈ S成立,則稱x控制瞭у。

  關於合作對策的解,直到現在還沒有一個完全令人滿意的定義。常見的定義有馮·諾伊曼-莫根施特恩解與沙普利解。前者是指由一些分配所成之集P滿足條件:①P中任何兩個分配之間不存在控制關系。② 對任何ZP必存在x∈P控制瞭Z。此種P不一定存在。後者基於從N的子集到n維空間(所得)的一個映像

= 它滿足:①對稱性,即

這裡 為{1,2,…, n}的一個排列, π -1 SS關於變換 π的逆;②有效性,即 η( v+ w)= η( v)+ η( w);③ ;這裡 vw皆為所給對策的特征函數。可以證明,隻有一個值滿足這三個性質,即

這裡 nS中局中人的個數, 表示隻就 N中所有不包含i的子集 S求和。此外,作為解的還有核心、核、核仁等。

  由於與合作對策有關的不少問題尚未解決,在目前的對策論研究中,合作對策居於重要位置,研究合作對策的解的定義仍是深受註意的課題。

  微分對策 對策這一概念有許多推廣,微分對策是其中之一,而且出現較早,發展也較成熟。前面所述的對策是局中人每走一步要作一次決定的離散情況。微分對策是局中人在每一時刻t皆要作出一個決定的連續情況,例如,追逃問題。追趕的和逃跑的每時每刻皆要作出某種選擇。設在時刻t,對局的狀態變量(例如位置、方向、速度等)為

。設在此時,局中人甲選取的策略(方向、速度等)為 ,於此, φ it的函數,一般可設 是常數;局中人乙選取瞭 ,亦滿足類似關系。 φψ稱為控制變量(策略),它們按照微分方程組

控制狀態變量的運動。當狀態變量到達某一給定的閉集 b時,對局即告結束。作為對策的支付,可以有幾種不同的形式。常用的有兩種:一為局終支付;一為積分支付。若對局是從 t=0時開始, t= T時終止,此時狀態變量的值為 y 1y 2,…, y n,則局中支付為一定義在 b上的函數 g( y 1y 2,…, y n),而積分支付則為 K為某一給定的函數。通過某種方程(主要方程)尋求最優的 φψ,是微分對策的基本課題之一。

  簡史 對策論這一概念的引入雖然可上溯到20世紀20年代,但是給以系統的研究,是由J.馮·諾伊曼和O.莫根施特恩開始的。他們合著的《競賽論與經濟行為》一書是一本奠基性的著作,書中主要考慮經濟方面的應用,認為經濟鬥爭是最容易數量化的。在第二次世界大戰中及其稍後,對策論曾被用來考慮軍事問題,希望用數學方法來處理策略這一概念。以後,對策論被應用於經濟問題以及一些社會科學中的問題,例如心理學(研究交易與協商的作用和性質)、政治學(各政治力量之間的聯合作用)。近年來,數理經濟學、特別是關於競爭平衡性問題、經濟的增長問題、資本的積累問題,等等,在其發展中受到對策論的很大影響。

  

參考書目

 J.馮·諾伊曼、O.莫根斯特恩著,王建華、顧瑋琳譯:《競賽論與經濟行為》,科學出版社,北京,1963。(J.von Neumannand O.Morgenstern,Theory of Games and Economic Behavior,Princeton Univ.Press,Princeton,1953.)

 J.C.C.麥克金賽著,高鴻勛等譯:《博弈論導引》,人民教育出版社,北京,1960。(J.C.C.Mckinsey,Introduction to the Theory of Games,McGraw-Hill,New York,1952.)

 R.D.Luce and H.Raiffe,Games and Decisions,John Wiley &Sons,New York,1957.

 R.Isaacs,Differential Games,John Wiley &Sons,1965.

 中國科學院數學研究所二室編:《對策論(博弈論)講義》,人民教育出版社,北京,1960。