對策論-百科詞條

　　又稱博弈論，研究由一些帶有相互競爭性質的個體所構成的體系的理論。一場競爭按競爭規則從開始到結束稱為局。參加競爭的個體稱為局中人，可以是某一個人，一個臨時的聯合體，一個隊，一個公司，一個政治團體，一個國傢，等等。若一局對策中有n個局中人，則稱此局為n人對策。局中的一次動作(著)，是指在某一時刻要求某一局中人作出一個決定。在一局對策中，每個局中人可能有許多供選用的方案來指揮他的動作作。局中人據以選取他的方案的規則稱之為一個策略。若一種規則可以決定局中人選取何種方案，而不是決定局中人以多大的概率選取何種方案，則稱此種規則為純策略；而把按某種概率來選取方案的規則稱為混合策略。若局中人甲有m個可供選用的純策略：α₁，α₂，…，α_m，則混合策略以概率向量

記之，其中 x _i是選用純策略 α _i的概率，且

。 n個局中人對局終瞭時各有所得（可以為正，也可以為零或負），以 p _i表示局中人i的所得，稱為支付，則對局的結果可用數字向量( p ₁， p ₂，…， p _n)表出。

　　對策的正規形式與展開形式　一個對策的正規形式是將所給的對策化為與之等價的如下的對策：當局中人在明白瞭對策的規則之後，各自在相互不知道的情況下選取一個純策略，然後將他所選的策略告訴一個毫無偏私的公正人。利用已經知道的規則，對局結果即告確定。

　　對策論中常用的另一種形式是展開形式，即依所給對策的特殊結構，按邏輯次序將所給對策寫成一個樹狀圖，每一個結點表示一次動作（步），從該點發出的樹枝表示在該次動作可供選取的方案，這種選擇可以是局中人自己決定的，也可以是依賴於某種隨機規律進行的。沒有樹枝發出的結點為一終端，可以根據對局規則在各終端、各樹枝將相應的已知信息寫出，並在各終端註上各局中人的所得。顯然，有瞭展開形式就可寫出正規形式。例如，設甲、乙二人鬥牌，共十二張牌，紅七綠五。每人先下賭註1份，然後發牌，先發甲一張，甲看後，可以放棄，也可以增加賭註3份再鬥。若甲放棄，則對局結束，此時若甲持紅牌則贏1份；若持綠牌則輸1份。倘若甲要鬥，則乙須考慮是相拼，還是認輸。若乙認輸，則甲贏1份；若乙相拼，則亮牌：甲為紅牌時甲贏4份；甲為綠牌時乙贏4份。以上過程可寫成展開式如下圖。

　　顯然，甲可能采取的策略有四：不管持牌是紅是綠皆鬥（記為α₁）；拿紅牌時才鬥（記為α₂）；拿綠牌時才鬥（記為α₃）；不管是紅是綠皆放棄（記為α₄）。乙的策略則為：相拼（記為β₁）和認輸（記為β₂）。於是，相應於展開式可得出正規形式：

容易算出此矩陣，例如對於 (α ₃， β ₁)，甲拿到綠牌的概率為5/12，此時乙要相拼；甲拿到紅牌的概率為7/12，此時甲放棄，甲的期望所得為和數

，此即表示甲、乙在互不知道的情況下，若甲選取的策略是 α ₃(拿綠牌時才鬥)，乙則選取 β ₁(相拼)，其結果是甲的期望所得為－13/12。

　　二人零和對策　它是對策論中最簡單而結果最為完整的部分。此時n=2，p₁+p₂=0，即甲的所得（失）是乙的所失（得）。設甲可供選用的策略共有m種：α₁，α₂，…，α_m；乙有n種：β₁，β₂，…，β_n。當甲采用α_i乙采用β_i時，甲的所得為α_ij（乙的所得為-α_ij），則此對策可用矩陣

表示，並記為 A= α _ij，因此又稱為矩陣對策。

　　一局對策的解，是指求出“明智的”局中人所采用的最優策略以及在此策略下的所得。若甲是"明智的"，則會認為當他采取策略α_i時乙必采取使

的策略

，因而當甲在考慮策略時所選取的 i ₀，應使

。同理，當乙考慮策略時所選取的 j ₀，應使

。容易證明，

，

若等號成立，則稱此局對策有一鞍點，或有一純策略解，但並不是每局對策皆有純策略解。例如關於對策

，上式的等號不成立。

　　混合策略　若甲與乙分別采取策略x與у，則其所得分別定義為

與

，其中 x _i、 y _j是x與у的分量。設x( Y)為所有概率向量x(у)組成的集，亦即甲（乙）的全部策略。若存在 x

∈( X， y

∈ Y，使得

X Y

^T A

。

若(x

，у

)是矩陣對策 A關於混合策略的一個鞍點，則定義 x

(у

)是甲（乙）的最優策略。 x

和у

可以利用線性規劃來尋求。

　　二人非零和對策　它的定義是：設n=2，且p₁+p₂≠0，意即甲的所得（失），並不一定就是乙的所失(得)。它與零和對策的主要差別是：對甲是好的策略，對乙不一定就是壞的。因此兩個局中人不一定全是對抗的，他們可以暴露自己的策略，使雙方同時受益。對於非零和對策，有兩種情況必須分開處理：非合作對策與合作對策。前者是指不許事先互通信息，不許結盟，不許搞聯合對策等；後者則不受此限制。

　　若局中人甲的所得可表示為A＝(α_ij)，乙的所得可表示為B＝(b_ij)，A、B皆為m×n矩陣，則此種對策稱為雙矩陣對策。

　　非合作對策的基本理論是在納什平衡點概念的基礎上建立起來的。設存在甲的一個混合策略x

和乙的一個混合策略у

，使得對於所有混合策略x、у皆有

則（ x

，у

）稱為此對策的一個平衡點。可以證明，任何雙矩陣非合作對策皆有平衡點。平衡點不一定是惟一的，也不一定是使雙方的所得是最好的，例如取

，

容易證明{（0，1），（0，1）}是一個平衡點，它對應的所得為(1，1)，但它顯然不如{(1，0)，(1，0)}對應的所得( α ₁₁， b ₁₁)=(2，2)來得好，而{（1，0），(1，0)}並不是平衡點。此時，甲、乙兩者的所得較多。因此，二人非零和對策的解必須再考慮別的因素。若兩向量x與x′滿足關系 x _i≥ x _i ^′(i=1，2，…， n)，則稱x控制x′。若對二人非零和對策，存在一平衡點所對應的所得控制所有其他的平衡點對應的所得，則定義該平衡點為此對策的解，但這種點並不總是存在的。

　　n人對策　對於非合作對策來說，n人對策與二人對策在處理方法上沒有本質的差別，但對於合作對策來說，其差異則很大。這主要是由於通過合作可以組成若幹集團，而其重點則在於結合的方式。

　　特征函數是用來研究合作對策的基本概念之一。它是一個實值集函數v(S)，這裡S為N={1，2，…，n}的一子集。v(S)應滿足下列條件：①v(ø)=0，ø表示空集。②v(S∪T)≥v(S)+v(T)，對於所有滿足S∩T=ø的N的子集S與T皆成立。N中的元素表示局中人，N的子集表示集團。條件②保證合作比不合作優越。合作對策的另一個基本概念是分配。所謂分配，是指具有下述性質的向量

，

：對於所有的i∈ N， x _i≥ v({i})；

，即必須保證每一入夥的人，通過加入集團所得不低於單幹所得。設x與у是兩個分配，若對於任一 S⊂ N有

，且 x _i＞ y _i，對所有的i∈ S成立，則稱x控制瞭у。

　　關於合作對策的解，直到現在還沒有一個完全令人滿意的定義。常見的定義有馮·諾伊曼-莫根施特恩解與沙普利解。前者是指由一些分配所成之集P滿足條件：①P中任何兩個分配之間不存在控制關系。② 對任何Z∉P必存在x∈P控制瞭Z。此種P不一定存在。後者基於從N的子集到n維空間（所得）的一個映像

它滿足：①對稱性，即

這裡

為{1，2，…， n}的一個排列， π ^-1 S為 S關於變換 π的逆；②有效性，即 η( v+ w)= η( v)+ η( w)；③

；這裡 v與 w皆為所給對策的特征函數。可以證明，隻有一個值滿足這三個性質，即

，

這裡 n是 S中局中人的個數，

表示隻就 N中所有不包含i的子集 S求和。此外，作為解的還有核心、核、核仁等。

　　由於與合作對策有關的不少問題尚未解決，在目前的對策論研究中，合作對策居於重要位置，研究合作對策的解的定義仍是深受註意的課題。

　　微分對策　對策這一概念有許多推廣，微分對策是其中之一，而且出現較早，發展也較成熟。前面所述的對策是局中人每走一步要作一次決定的離散情況。微分對策是局中人在每一時刻t皆要作出一個決定的連續情況，例如，追逃問題。追趕的和逃跑的每時每刻皆要作出某種選擇。設在時刻t，對局的狀態變量(例如位置、方向、速度等)為

。設在此時，局中人甲選取的策略(方向、速度等)為

，於此， φ _i為 t的函數，一般可設

是常數；局中人乙選取瞭

，亦滿足類似關系。 φ和 ψ稱為控制變量（策略），它們按照微分方程組

，

控制狀態變量的運動。當狀態變量到達某一給定的閉集 b時，對局即告結束。作為對策的支付，可以有幾種不同的形式。常用的有兩種：一為局終支付；一為積分支付。若對局是從 t=0時開始， t= T時終止，此時狀態變量的值為 y ₁， y ₂，…， y _n，則局中支付為一定義在 b上的函數 g( y ₁， y ₂，…， y _n)，而積分支付則為

， K為某一給定的函數。通過某種方程(主要方程)尋求最優的 φ和 ψ，是微分對策的基本課題之一。

　　簡史　對策論這一概念的引入雖然可上溯到20世紀20年代，但是給以系統的研究，是由J.馮·諾伊曼和O.莫根施特恩開始的。他們合著的《競賽論與經濟行為》一書是一本奠基性的著作，書中主要考慮經濟方面的應用，認為經濟鬥爭是最容易數量化的。在第二次世界大戰中及其稍後，對策論曾被用來考慮軍事問題，希望用數學方法來處理策略這一概念。以後，對策論被應用於經濟問題以及一些社會科學中的問題，例如心理學（研究交易與協商的作用和性質）、政治學（各政治力量之間的聯合作用）。近年來，數理經濟學、特別是關於競爭平衡性問題、經濟的增長問題、資本的積累問題，等等，在其發展中受到對策論的很大影響。

參考書目

　J.馮·諾伊曼、O.莫根斯特恩著，王建華、顧瑋琳譯：《競賽論與經濟行為》，科學出版社，北京，1963。(J.von Neumannand O.Morgenstern，Theory of Games and Economic Behavior，Princeton Univ.Press，Princeton，1953.)

　J.C.C.麥克金賽著，高鴻勛等譯：《博弈論導引》，人民教育出版社，北京，1960。(J.C.C.Mckinsey，Introduction to the Theory of Games，McGraw-Hill，New York，1952.)

　R.D.Luce and H.Raiffe，Games and Decisions，John Wiley &Sons，New York，1957.

　R.Isaacs，Differential Games，John Wiley &Sons，1965.

　中國科學院數學研究所二室編：《對策論（博弈論）講義》，人民教育出版社，北京，1960。