又稱博弈論,研究由一些帶有相互競爭性質的個體所構成的體系的理論。一場競爭按競爭規則從開始到結束稱為局。參加競爭的個體稱為局中人,可以是某一個人,一個臨時的聯合體,一個隊,一個公司,一個政治團體,一個國傢,等等。若一局對策中有n個局中人,則稱此局為n人對策。局中的一次動作(著),是指在某一時刻要求某一局中人作出一個決定。在一局對策中,每個局中人可能有許多供選用的方案來指揮他的動作作。局中人據以選取他的方案的規則稱之為一個策略。若一種規則可以決定局中人選取何種方案,而不是決定局中人以多大的概率選取何種方案,則稱此種規則為純策略;而把按某種概率來選取方案的規則稱為混合策略。若局中人甲有m個可供選用的純策略:α1,α2,…,αm,則混合策略以概率向量
![](/img3/3426.gif)
![](/img3/3427.gif)
對策的正規形式與展開形式 一個對策的正規形式是將所給的對策化為與之等價的如下的對策:當局中人在明白瞭對策的規則之後,各自在相互不知道的情況下選取一個純策略,然後將他所選的策略告訴一個毫無偏私的公正人。利用已經知道的規則,對局結果即告確定。
對策論中常用的另一種形式是展開形式,即依所給對策的特殊結構,按邏輯次序將所給對策寫成一個樹狀圖,每一個結點表示一次動作(步),從該點發出的樹枝表示在該次動作可供選取的方案,這種選擇可以是局中人自己決定的,也可以是依賴於某種隨機規律進行的。沒有樹枝發出的結點為一終端,可以根據對局規則在各終端、各樹枝將相應的已知信息寫出,並在各終端註上各局中人的所得。顯然,有瞭展開形式就可寫出正規形式。例如,設甲、乙二人鬥牌,共十二張牌,紅七綠五。每人先下賭註1份,然後發牌,先發甲一張,甲看後,可以放棄,也可以增加賭註3份再鬥。若甲放棄,則對局結束,此時若甲持紅牌則贏1份;若持綠牌則輸1份。倘若甲要鬥,則乙須考慮是相拼,還是認輸。若乙認輸,則甲贏1份;若乙相拼,則亮牌:甲為紅牌時甲贏4份;甲為綠牌時乙贏4份。以上過程可寫成展開式如下圖。
![](/img3/3428.jpg)
顯然,甲可能采取的策略有四:不管持牌是紅是綠皆鬥(記為α1);拿紅牌時才鬥(記為α2);拿綠牌時才鬥(記為α3);不管是紅是綠皆放棄(記為α4)。乙的策略則為:相拼(記為β1)和認輸(記為β2)。於是,相應於展開式可得出正規形式:
![](/img3/3429.gif)
![](/img3/3430.gif)
![](/img3/3431.gif)
二人零和對策 它是對策論中最簡單而結果最為完整的部分。此時n=2,p1+p2=0,即甲的所得(失)是乙的所失(得)。設甲可供選用的策略共有m種:α1,α2,…,αm;乙有n種:β1,β2,…,βn。當甲采用αi乙采用βi時,甲的所得為αij(乙的所得為-αij),則此對策可用矩陣
![](/img3/3432.gif)
一局對策的解,是指求出“明智的”局中人所采用的最優策略以及在此策略下的所得。若甲是"明智的",則會認為當他采取策略αi時乙必采取使
![](/img3/3433.gif)
![](/img3/3434.gif)
![](/img3/3435.gif)
![](/img3/3436.gif)
![](/img3/3437.gif)
![](/img3/3438.gif)
![](/img3/3439.gif)
混合策略 若甲與乙分別采取策略x與у,則其所得分別定義為
![](/img3/3440.gif)
![](/img3/3441.gif)
![](/img3/3442.gif)
![](/img3/3442.gif)
![](/img3/3443.gif)
![](/img3/3442.gif)
![](/img3/3442.gif)
![](/img3/3444.gif)
若(x
![](/img3/3442.gif)
![](/img3/3442.gif)
![](/img3/3442.gif)
![](/img3/3442.gif)
![](/img3/3442.gif)
![](/img3/3442.gif)
二人非零和對策 它的定義是:設n=2,且p1+p2≠0,意即甲的所得(失),並不一定就是乙的所失(得)。它與零和對策的主要差別是:對甲是好的策略,對乙不一定就是壞的。因此兩個局中人不一定全是對抗的,他們可以暴露自己的策略,使雙方同時受益。對於非零和對策,有兩種情況必須分開處理:非合作對策與合作對策。前者是指不許事先互通信息,不許結盟,不許搞聯合對策等;後者則不受此限制。
若局中人甲的所得可表示為A=(αij),乙的所得可表示為B=(bij),A、B皆為m×n矩陣,則此種對策稱為雙矩陣對策。
非合作對策的基本理論是在納什平衡點概念的基礎上建立起來的。設存在甲的一個混合策略x
![](/img3/3442.gif)
![](/img3/3442.gif)
![](/img3/3445.gif)
![](/img3/3442.gif)
![](/img3/3442.gif)
![](/img3/3446.gif)
n人對策 對於非合作對策來說,n人對策與二人對策在處理方法上沒有本質的差別,但對於合作對策來說,其差異則很大。這主要是由於通過合作可以組成若幹集團,而其重點則在於結合的方式。
特征函數是用來研究合作對策的基本概念之一。它是一個實值集函數v(S),這裡S為N={1,2,…,n}的一子集。v(S)應滿足下列條件:①v(ø)=0,ø表示空集。②v(S∪T)≥v(S)+v(T),對於所有滿足S∩T=ø的N的子集S與T皆成立。N中的元素表示局中人,N的子集表示集團。條件②保證合作比不合作優越。合作對策的另一個基本概念是分配。所謂分配,是指具有下述性質的向量
![](/img3/3447.gif)
![](/img3/3448.gif)
![](/img3/3449.gif)
![](/img3/3450.gif)
關於合作對策的解,直到現在還沒有一個完全令人滿意的定義。常見的定義有馮·諾伊曼-莫根施特恩解與沙普利解。前者是指由一些分配所成之集P滿足條件:①P中任何兩個分配之間不存在控制關系。② 對任何Z∉P必存在x∈P控制瞭Z。此種P不一定存在。後者基於從N的子集到n維空間(所得)的一個映像
![](/img3/3451.gif)
![](/img3/3452.gif)
![](/img3/3453.gif)
![](/img3/3454.gif)
![](/img3/3455.gif)
![](/img3/3456.gif)
![](/img3/3457.gif)
![](/img3/3458.gif)
由於與合作對策有關的不少問題尚未解決,在目前的對策論研究中,合作對策居於重要位置,研究合作對策的解的定義仍是深受註意的課題。
微分對策 對策這一概念有許多推廣,微分對策是其中之一,而且出現較早,發展也較成熟。前面所述的對策是局中人每走一步要作一次決定的離散情況。微分對策是局中人在每一時刻t皆要作出一個決定的連續情況,例如,追逃問題。追趕的和逃跑的每時每刻皆要作出某種選擇。設在時刻t,對局的狀態變量(例如位置、方向、速度等)為
![](/img3/3459.gif)
![](/img3/3460.gif)
![](/img3/3461.gif)
![](/img3/3462.gif)
![](/img3/3463.gif)
![](/img3/3464.gif)
簡史 對策論這一概念的引入雖然可上溯到20世紀20年代,但是給以系統的研究,是由J.馮·諾伊曼和O.莫根施特恩開始的。他們合著的《競賽論與經濟行為》一書是一本奠基性的著作,書中主要考慮經濟方面的應用,認為經濟鬥爭是最容易數量化的。在第二次世界大戰中及其稍後,對策論曾被用來考慮軍事問題,希望用數學方法來處理策略這一概念。以後,對策論被應用於經濟問題以及一些社會科學中的問題,例如心理學(研究交易與協商的作用和性質)、政治學(各政治力量之間的聯合作用)。近年來,數理經濟學、特別是關於競爭平衡性問題、經濟的增長問題、資本的積累問題,等等,在其發展中受到對策論的很大影響。
參考書目
J.馮·諾伊曼、O.莫根斯特恩著,王建華、顧瑋琳譯:《競賽論與經濟行為》,科學出版社,北京,1963。(J.von Neumannand O.Morgenstern,Theory of Games and Economic Behavior,Princeton Univ.Press,Princeton,1953.)
J.C.C.麥克金賽著,高鴻勛等譯:《博弈論導引》,人民教育出版社,北京,1960。(J.C.C.Mckinsey,Introduction to the Theory of Games,McGraw-Hill,New York,1952.)
R.D.Luce and H.Raiffe,Games and Decisions,John Wiley &Sons,New York,1957.
R.Isaacs,Differential Games,John Wiley &Sons,1965.
中國科學院數學研究所二室編:《對策論(博弈論)講義》,人民教育出版社,北京,1960。