遊戲理論

遊戲理論是對理性代理之間戰略互動的數學模型的研究。它在許多社會科學領域都有應用,在經濟學系統科學計算機科學領域廣泛使用。傳統的遊戲理論涉及兩人零和遊戲,其中參與者的收益或損失與其他參與者的損失和收益完全平衡。在21世紀,遊戲理論適用於更廣泛的行為關係,現在它是人類,動物和計算機邏輯決策科學保護術語

現代遊戲理論始於在兩人零和遊戲中的混合策略平衡的想法,以及約翰·馮·諾伊曼( John von Neumann)的證明。馮·諾伊曼(von Neumann)的原始證明使用了布魯維爾(Brouwer)定理的連續映射定理成緊湊的凸組集,這成為遊戲理論和數學經濟學的標準方法。他的論文之後是遊戲與經濟行為理論(1944年),與奧斯卡·莫根斯特(Oskar Morgenstern)共同撰寫,後者考慮了幾位玩家的合作遊戲。第二版提供了預期效用的公理理論,該理論允許數學統計學家和經濟學家在不確定性下對決策進行處理。

遊戲理論是在1950年代廣泛發展的,在1970年代被明確應用於進化,儘管類似的發展至少可以追溯到1930年代。在許多領域,遊戲理論已被廣泛認為是重要的工具。約翰·梅納德·史密斯(John Maynard Smith)於1999年因其進化遊戲理論的應用而獲得了克拉福德獎,截至2020年,有15個遊戲理論家贏得了諾貝爾經濟學獎,其中包括最近的保羅·米爾格羅姆( Paul Milgrom )和羅伯特· B·威爾遜(Robert B. Wilson)

歷史

前體

在現代數學遊戲理論的興起之前,就遊戲的數學進行了討論。 Cardano的作品Liber de Ludo Aleae關於機會遊戲的書)是在1564年左右寫的,但在1663年死後出版,在偶然遊戲遊戲中繪製了一些基本思想。在1650年代,帕斯卡爾(Pascal )和霍根斯( Huygens)開發了關於機會結構的推理的期望概念。當機會平等時,帕斯卡(Pascal)主張平等分裂,而霍根斯(Huygens)通過考慮可以與任何對手進行任何賭注的球員的策略來擴大論點,只要其術語相等。 Huygens後來在1657年在LudoAleæ偶然的推理)中發表了他的賭博演算為De Ratiociniis。

1713年,一個活躍的雅各布特(Jacobite)和叔叔查爾斯·沃爾德格雷夫(Charles Waldegrave)歸功於英國外交官詹姆斯·沃爾德格雷夫( James Waldegrave)的一封信,分析了一場名為“ le her her ”的遊戲。 Waldegrave為兩人版本的紙牌遊戲提供了Minimax混合策略解決方案,現在該問題被稱為Waldegrave問題。 1838年,安托萬·奧古斯丁·庫諾特(Antoine Augustin Cournot)考慮了兩頭妓女,並提出了一種解決方案,該解決方案是遊戲的納什均衡,在他的融合,校長MathématiquesdelaThéoriedes Richesses(研究財富理論的數學原理)。

1913年,歐恩斯特·澤梅洛(Ernst Zermelo)出版了übereine anwendung der Mengenlehre auf die die deorie des Schachspiels關於集合理論在國際象棋理論中的應用),這證明了最佳國際象棋策略是嚴格確定的。這為更一般的定理鋪平了道路。

1938年,丹麥數學經濟學家Frederik Zeuthen證明了數學模型通過使用Brouwer的固定點定理具有獲勝的策略。在他的1938年書籍應用程序Aux jeux de Hasard和早期筆記中,僅當收益矩陣是對稱的,並為非瑣事的無限遊戲提供解決方案(僅當報酬矩陣時,才證明了兩人零和矩陣遊戲的最小定理(在英語中為blotto遊戲)。 Borel猜想在有限的兩人零和遊戲中,混合構成平衡的不存在,這一猜想被馮·諾伊曼(Von Neumann)證明是虛假的。

出生和早期發展

約翰·馮·諾伊曼(John von Neumann)

當約翰·馮·諾伊曼(John von Neumann)於1928年發表有關戰略遊戲理論的論文時,遊戲理論成為了一個獨特的領域·諾伊曼(Von Neumann)的原始證明使用了布魯沃爾(Brouwer數學經濟學。馮·諾伊曼(Von Neumann)在遊戲理論中的作品最終與他的1944年《遊戲與經濟行為理論》一書,與奧斯卡·莫根斯特(Oskar Morgenstern)合著。這本書的第二版提供了公理的實用性理論,該理論將丹尼爾·伯諾利(Daniel Bernoulli)的舊效用理論(金錢)作為獨立學科。這項基礎工作包含了為兩人零和遊戲尋找相互一致的解決方案的方法。隨後的工作主要集中在合作遊戲理論上,該理論分析了個人群體的最佳策略,認為他們可以在他們之間就適當的策略實施協議。

約翰·納什(John Nash)

1950年,出現了關於囚犯困境的第一次數學討論,著名數學家Merrill M. FloodMelvin Dresher進行了實驗,這是Rand Corporation對遊戲理論的調查的一部分。蘭德(Rand)由於可能適用於全球核戰略而進行了研究。大約在同一時間,約翰·納什(John Nash)制定了一個被稱為納什均衡的玩家策略的相互一致性的標準,該標準適用於馮·諾伊曼(Von Neumann)和摩根斯特恩(Morgenstern )提出的標準,適用於多種多樣的遊戲。納什(Nash)證明,每個有限的N玩家,非零-AM(不僅僅是兩個玩家零和)非合作遊戲的遊戲都在混合策略中都稱為NASH平衡。

遊戲理論在1950年代經歷了一系列活動,在此期間,核心的概念,廣泛的表單遊戲虛擬遊戲重複遊戲沙普利價值得到了發展。 1950年代還看到了遊戲理論對哲學政治學的最初應用。

獲獎成就

1965年,萊因哈德·塞爾滕(Reinhard Selten)介紹了他的解決方案概念,該概念進一步完善了納什平衡。後來他也會引入顫抖的手。 1994年,納什(Nash),塞爾滕(Selten)和哈薩尼( Harsanyi)因其對經濟遊戲理論的貢獻而成為經濟學諾貝爾獎獲得者

在1970年代,遊戲理論在生物學中廣泛應用,這主要是由於約翰·梅納德·史密斯(John Maynard Smith)的工作及其進化穩定的策略。此外,引入和分析了相關平衡顫抖的手的完美常識的概念。

1994年,約翰·納什(John Nash)因其對遊戲理論的貢獻而獲得經濟科學諾貝爾紀念獎。納什(Nash)對遊戲理論的最著名貢獻是納什均衡的概念,它是非合作遊戲的解決方案概念。 NASH平衡是一組策略,每個球員都可以通過單方面改變其策略來提高他們的回報。

2005年,遊戲理論家托馬斯·謝林(Thomas Schelling)羅伯特·奧曼(Robert Aumann)跟隨納什(Nash),塞爾滕(Selten)和哈薩尼(Harsanyi)擔任諾貝爾獎獲得者。 Schelling研究了動態模型,即進化遊戲理論的早期示例。 Aumann為平衡學校做出了更多的貢獻,引入了均衡的均衡和相關的均衡,並對常識及其後果的假設進行了廣泛的正式分析。

2007年,列昂尼德·赫維奇(Leonid Hurwicz)埃里克·馬斯汀(Eric Maskin )和羅傑·邁爾森( Roger Myerson)被授予諾貝爾經濟學獎,“奠定了機制設計理論的基礎”。邁爾森的貢獻包括適當平衡的概念,以及重要的研究生文本:遊戲理論,衝突分析。 Hurwicz介紹並正式化了激勵兼容性的概念。

2012年,阿爾文·羅斯( Alvin E. 2014年,諾貝爾(Nobel)參加了遊戲理論家讓·蒂羅爾(Jean Tirole)

不同類型的遊戲

合作 /不合作

如果玩家能夠在外部執行(例如,通過合同法)形成具有約束力的承諾,則遊戲是合作的。如果玩家無法形成聯盟,或者所有協議都需要自我執行(例如,通過可靠的威脅),遊戲是不合作的

經常通過合作遊戲理論的框架來分析合作遊戲,該理論的重點是預測將形成哪些聯盟,團體採取的聯合行動以及由此產生的集體收益。它與傳統的非合作遊戲理論相反,該理論的重點是預測各個玩家的行動和回報和分析納什均衡。對個人回報的關注可能會導致一種被稱為Commons的悲劇的現象,其中資源用於集體效率低下。缺乏正式的談判導致通過過度使用和根據私人激勵措施的規定來惡化公共物品。

合作遊戲理論提供了一種高級方法,因為它僅描述了聯盟的結構,策略和收益,而非合作的遊戲理論也介紹了討價還價程序將如何影響每個聯盟內收益的分佈。由於非合作遊戲理論更為籠統,因此可以通過非合作遊戲理論的方法(Converse not Conn)來分析合作遊戲,只要有足夠的假設來涵蓋玩家可用的所有可能策略,因為這種可能性可能會出現。外部執行合作。儘管可能需要使用單個理論,但在許多情況下,信息不足以準確地對戰略談判過程中可用的正式程序進行建模,或者結果模型太複雜了,無法在現實世界中提供實用工具。在這種情況下,合作遊戲理論提供了一種簡化的方法,可以使遊戲總體分析,而無需對議價能力做出任何假設。

對稱 /不對稱

E F
E 1, 2 0, 0
F 0, 0 1, 2
不對稱的遊戲

對稱遊戲是一個遊戲,每個玩家在做出相同的選擇時都會獲得相同的回報。換句話說,玩家的身份不會改變另一個玩家面臨的結果遊戲。許多經常研究的2×2遊戲都是對稱的。雞肉,囚犯的困境和雄鹿狩獵的標準表現都是對稱的遊戲。一些學者也將某些不對稱遊戲視為這些遊戲的示例。但是,這些遊戲中最常見的收益是對稱的。

最常見的不對稱遊戲是兩個玩家都沒有相同策略集的遊戲。例如,最後通遊戲獨裁者遊戲對每個玩家都有不同的策略。但是,遊戲有可能為兩個玩家製定相同的策略,但不對稱。例如,儘管對兩個玩家都有相同的策略集,但本節圖形中所示的遊戲是不對稱的。

零和非零和非零和

A B
A –1, 1 3, –3
B 0, 0 –2, 2
零和遊戲

零和遊戲(更一般而言,恆定遊戲)是遊戲中的遊戲,玩家的選擇既不能增加也不能減少可用資源。在零和遊戲中,對於每種策略組合,全部利益都歸功於所有玩家,並且始終增加零(更非正式的是,玩家僅以同等的費用以其他人的費用)。撲克體現了一個零和遊戲(忽略了房屋被砍伐的可能性),因為一個人贏得了對手的損失。其他零和遊戲的遊戲包括匹配的便士和大多數古典棋盤遊戲,包括GoChess

遊戲理論家(包括著名的囚犯困境)研究的許多遊戲都是非零和遊戲的遊戲,因為結果的淨結果大於零。從非正式的情況下,在非零和遊戲中,一個玩家的收益不一定與另一個玩家的損失相對應。

恆定的遊戲對應於盜竊和賭博等活動,但與貿易潛在收益的基本經濟狀況相對應。通過添加一個虛擬玩家(通常稱為“董事會”),將任何恆定的遊戲變成(可能是不對稱的)零和遊戲,他們的損失可以補償球員的淨贏。

同時 /順序

同時遊戲是兩個玩家同時移動的遊戲,或者後來的玩家不知道早期玩家的動作(使他們有效同時同時)。連續遊戲(或動態遊戲)是玩家不會同時做出決定的遊戲,並且玩家的早期動作會影響其他玩家的結果和決策。這不必是關於早期玩家的每一個動作的完美信息;這可能是很少的知識。例如,玩家可能知道較早的玩家沒有執行一個特定的動作,而他們不知道第一個玩家實際執行的其他可用動作中的哪個。

同時遊戲和順序遊戲之間的差異在上面討論的不同表示形式中捕獲。通常,正常形式用於表示同時遊戲,而廣泛的形式則用於表示順序。廣泛形式到正常形式的轉換是一種方式,這意味著多個廣泛的表單遊戲對應於相同的正常形式。因此,同時遊戲的平衡概念不足以推理順序遊戲。請參閱子遊戲完美

簡而言之,順序和同時遊戲之間的差異如下:

順序 同時
通常表示 決策樹 回報矩陣
對手的事務的先驗知識?
是的
時軸? 是的
也稱為
廣泛的遊戲擴展遊戲
策略遊戲策略遊戲

完美的信息和不完美的信息

不完美的信息遊戲。虛線表示玩家2的無知,正式稱為信息集

連續遊戲的重要子集由完美信息的遊戲組成。具有完美信息的遊戲意味著,所有玩家在遊戲中的每一步都知道遊戲的先前歷史以及所有其他玩家先前做出的動作。實際上,這可以應用於市場中所有可用商品的價格和質量信息的公司和消費者。當玩家不知道對手已經做出的所有動作,例如同時移動遊戲,就會玩不完美的信息遊戲。遊戲理論中研究的大多數遊戲都是不完美的信息遊戲。完美信息遊戲的示例包括TIC-TAC-TOECheckersChessGo

許多紙牌遊戲都是不完美的信息,例如撲克橋樑。完美的信息通常與完整的信息相混淆,這是一個類似的概念,與每個玩家的序列,策略和收益的共同知識有關。完整的信息要求每個玩家都知道其他玩家可用的策略和回報,但不一定是採取的行動,而完美的信息是了解遊戲和玩家的各個方面。但是,不完整的信息可以通過引入“自然動作”來減少不完美信息的遊戲。

貝葉斯遊戲

納什均衡的假設之一是,每個玩家都對其他玩家的行為有正確的信念。但是,遊戲理論中有許多情況,參與者沒有完全理解對手的特徵。談判者可能不知道對手對談判的估值,公司可能不知道對手的成本職能,戰鬥人員可能沒有意識到對手的優勢,陪審員可能不知道同事在審判中對證據的解釋。在某些情況下,參與者可能會很好地知道對手的性格,但可能不知道對手對自己或她自己的性格的了解程度。

貝葉斯遊戲是指具有不完整信息的戰略遊戲。對於戰略遊戲,決策者是玩家,每個玩家都有一組動作。不完美信息規範的核心部分是狀態集。每個州都完全描述了與玩家相關的特徵集合,例如他們的偏好及其細節。某些玩家認為可能存在的每組功能都必須有一個狀態。

貝葉斯遊戲的示例

例如,如果玩家1不確定玩家2是寧願與她約會還是遠離她,而玩家2則像以前一樣了解玩家1的偏好。要具體而言,假設玩家1認為玩家2希望以1/2的概率與她約會,並以1/2的概率離開她(此評估可能來自球員1的經驗:她面對想要的球員在這種情況下,她的一半時間和想要避免她一半時間的球員)。由於涉及的概率,對這種情況的分析需要了解玩家對抽籤的偏好,即使人們只對純粹的戰略平衡感興趣。

組合遊戲

尋找最佳策略的難度源於可能的動作的多種多樣,稱為組合遊戲。例子包括國際象棋和棋子。涉及不完美信息的遊戲也可能具有強大的組合特徵,例如反登蒙。沒有統一的理論來解決遊戲中的組合元素。但是,有數學工具可以解決一些特定的問題並回答一些一般問題。

完美信息的遊戲已在組合遊戲理論中研究,該理論已經開發了新穎的表現,例如超現實數字,以及組合代數有時是非構造性)證明方法來解決某些類型的遊戲,包括“ Loopopy”遊戲,可能導致無限長的移動序列。這些方法比傳統(或“經濟”)遊戲理論中通常考慮的遊戲更高的組合複雜性。以這種方式解決的典型遊戲是十六進制。來自計算複雜性理論的相關研究領域是遊戲的複雜性,這與估計查找最佳策略的計算難度有關。

人工智能的研究已經解決了具有非常複雜的組合結構(例如國際象棋,GO或Backgammon)的完美和不完美的信息遊戲,但沒有發現可證明的最佳策略。實用的解決方案涉及計算啟發式方法,例如修剪α -beta修剪或使用強化學習訓練的人工神經網絡,這使遊戲在計算實踐中更具易處理性。

無限長的遊戲

正如經濟學家和現實世界中的遊戲玩家所研究的遊戲,通常會以有限的動作完成。純粹的數學家並不是那麼受到限制,並將理論家設置為持續很多動作的研究遊戲,直到所有這些舉動完成,贏家(或其他回報)才知道。

關注的焦點通常不是在玩這樣的遊戲的最佳方式上,而是一個玩家是否有勝利策略。 (可以使用選擇的公理可以證明,即使有完美的信息以及唯一的結果是“勝利”或“損失”的遊戲,這兩個玩家都沒有贏得策略。)存在此類策略對於巧妙設計的遊戲,在描述性集理論中產生了重要的後果。

離散遊戲

遊戲理論的大部分內容都與有限的離散遊戲有關,這些遊戲具有有限的玩家,動作,事件,成果等。但是,許多概念都可以擴展。連續遊戲使玩家可以從連續策略集中選擇策略。例如, Cournot競爭通常以玩家的策略為模型,包括任何非負數數量,包括分數數量。

連續遊戲使玩家可以根據某些規則進行互動,主要是在玩家之間執行通信協議。通過溝通,已經註意到玩家願意在公共優質遊戲中提供更多的商品,而不是在離散遊戲中提供的商品,因此,玩家能夠比離散更有效地管理資源遊戲,因為他們彼此共享資源,想法和策略。這激勵並導致連續遊戲的中位合作率更高。

差異遊戲

諸如持續追求和逃避遊戲之類的差異遊戲是連續的遊戲,在這種遊戲中,玩家的狀態變量的演變受微分方程的約束。在差異遊戲中找到最佳策略的問題與最佳控制理論密切相關。特別是,有兩種類型的策略:使用Pontryagin最大原理發現開環策略,而使用Bellman的動態編程方法發現了閉環策略。

差異遊戲的特定情況是隨機時間範圍的遊戲。在這樣的遊戲中,終端時間是一個隨機變量,具有給定的概率分佈函數。因此,玩家最大程度地提高了成本函數的數學期望。結果表明,在無限的時間間隔內,可以將修改的優化問題重新構成折扣差異遊戲。

進化遊戲理論

進化遊戲理論研究的玩家會根據不一定是理性或有遠見的規則來調整其策略。總的來說,隨著時間的推移,策略隨著這種規則的發展而建立為Markov鏈,該鏈具有具有當前策略概況的狀態變量,或者在最近的過去如何玩遊戲。此類規則可能具有仿製,優化或適得其來的生存。

在生物學中,這樣的模型可以代表進化,其中後代採用父母的策略,而父母則採用更成功的策略(即與高收益相對應)具有更多的後代。在社會科學中,這種模型通常代表在一生中玩多次遊戲的玩家的戰略調整,並且有意識或無意識地,偶爾會調整其策略。

隨機結果(以及與其他領域的關係)

隨機結果的個人決策問題有時被視為“單人遊戲”。它們可以在決策理論運營研究人工智能領域的相關學科中使用類似工具進行建模,尤其是AI計劃(不確定性)和多代理系統。儘管這些領域可能具有不同的動力,但涉及的數學基本相同,例如使用馬爾可夫決策過程(MDP)。

隨機結果也可以通過添加一個隨機代理玩家來建模,該播放器使“機會移動”(“自然而然地移動”)。該玩家通常不被視為否則兩人遊戲的第三名玩家,而只是在遊戲需要的情況下提供一卷骰子。

對於某些問題,建模隨機結果的不同方法可能會導致不同的解決方案。例如,MDPS和Minimax解決方案之間的方法差異是,後者考慮了一組對抗性移動的最差案例,而不是考慮到固定概率分佈的這些移動的預期。在不確定性的隨機模型的情況下,Minimax方法可能是有利的,但也可能高估了極不可能(但昂貴)的事件,如果假定對手可以迫使這種事件發生,則在這種情況下會極大地搖擺這種策略。 (有關此類建模問題的更多討論,請參見黑天鵝理論,尤其是與預測和限制投資銀行業務的損失有關。)

還研究了包括隨機結果的所有要素,對手以及部分或嘈雜的可觀察性(其他玩家的舉動)的一般模型。 “黃金標準”被認為是部分可觀察到的隨機遊戲(POSG),但是在POSG表示中,很少有現實的問題在計算上是可行的。

metagames

這些遊戲是另一個遊戲,目標或主題遊戲的規則的製定。 Metagames試圖最大化開發規則集的效用價值。 Metagames的理論與機理設計理論有關。

Metagame Analysis一詞還用於指奈傑爾·霍華德(Nigel Howard)開發的一種實用方法,在該方法中,情況被框起來是一種戰略遊戲,利益相關者試圖通過可用的選項來實現其目標。隨後的發展導致對抗分析的製定。

合併遊戲

這些遊戲勝過各種形式的社會。在經驗豐富的道路上,一般的收益表不斷變化,其平衡策略通常會採取進化社會公約和經濟公約的形式。匯總遊戲理論出現是為了正式認識一個遊戲中最佳選擇與即將到來的回報表更新路徑的出現,確定不變性的存在和魯棒性,並隨著時間的推移預測差異。該理論基於隨著時間的時間更新的回報表更新的拓撲轉換分類,以預測差異和不變性,並且還屬於有序系統的可觸及最優性計算法律的管轄權。

平均野外遊戲理論

平均現場遊戲理論是對大量小型相互作用代理人中戰略決策的研究。 Boyan JovanovicRobert W. Rosenthal在經濟學文獻中考慮了這類問題,彼得·E ·凱恩斯( Peter E.

遊戲的代表

遊戲理論研究的遊戲是定義明確的數學對象。要充分定義,遊戲必須指定以下元素:遊戲的玩家,每個決策點上可用的信息動作以及每個結果的回報。 (埃里克·拉斯穆森這些策略是採用的,沒有球員可以單方面偏離其策略來獲利。這些均衡策略決定了遊戲的平衡- 在該狀態下發生一個結果或以已知概率發生一組結果。

在遊戲中,玩家通常會有“主導策略”,在這種策略中,他們會激勵他們選擇最佳的策略,從而使他們獲得最大的回報,即使其他玩家更改了他們的策略或選擇其他選項,也要堅持下去。但是,根據可能的回報,其中一位球員可能沒有“主導策略”,而另一個球員則可能沒有。沒有主導策略的球員並不是確認另一個球員不會擁有自己的主導策略,這使第一個球員處於直接的劣勢。

但是,當他們選擇的策略及其回報占主導地位時,兩位球員都有擁有主導策略的機會,而合併的回報構成了平衡。發生這種情況時,它會產生主要的策略平衡。這可能會導致社交困境,其中游戲具有由兩個或多個具有主要策略的玩家創造的平衡,並且遊戲的解決方案與對遊戲的合作解決方案不同。

還有一個玩家擁有多個主導策略的機會。當對第二個玩家的多種策略做出反應時,就會發生這種情況,而第一個玩家的單獨響應彼此具有不同的策略。這意味著遊戲中沒有發生納什均衡的機會。

大多數合作遊戲都以特徵功能形式呈現,而廣泛的和正常形式用於定義非合作遊戲。

廣泛的形式

廣泛的表格遊戲

廣泛的表格可用於通過動作的時間測序進行正式化遊戲。可以使用遊戲可視化廣泛的表單遊戲(如圖所示)。這裡每個頂點(或節點)代表玩家的選擇點。播放器由頂點列出的數字指定。頂點的線代表了該玩家的可能動作。收益在樹的底部指定。廣泛的形式可以看作是決策樹的多玩家概括。要解決任何廣泛的表單遊戲,必須使用向後感應。它涉及向後工作遊戲樹,以確定理性玩家在樹的最後一個頂點中會做什麼,鑑於最後一步的玩家是理性的,依此類推,依此類推,直到第一個到達樹的頂點。

圖片的遊戲由兩個玩家組成。該特定遊戲的結構方式(即具有連續的決策和完美的信息),播放器1首先選擇fu (公平或不公平)來“移動”。接下來是序列中,現在已經觀察到玩家1移動的玩家2可以選擇播放AR (接受或拒絕)。一旦玩家2做出了選擇,遊戲就可以完成,每個玩家都會獲得各自的回報,在圖像中表示為兩個數字,其中第一個數字代表玩家1的回報,第二個數字代表玩家2的回報。假設播放器1選擇u ,然後播放器2選擇A播放器1然後獲得“八”的回報(在現實世界中可以用多種方式來解釋,其中最簡單的是金錢,但可能意味著什麼例如八天的假期或八個國家征服,甚至還有八個與其他玩家一起玩相同遊戲的機會),玩家2的回報為“兩個”。

廣泛的表格還可以通過不完美的信息來捕獲同時播放的遊戲和遊戲。為了表示,虛線可以連接不同的頂點,以表示它們是相同信息集的一部分(即玩家不知道他們在哪個時候),或者在它們周圍繪製了封閉的線路。 (請參閱“不完美信息”部分中的示例。)

正常形式

球員2剩下 玩家2選擇正確
玩家1選擇 4, 3 –1, –1
播放器1選擇 0, 0 3, 4
2玩家,2策略遊戲的正常形式或回報矩陣

正常(或戰略形式)遊戲通常由矩陣表示,該矩陣顯示玩家,策略和收益(請參見右邊的示例)。通常,它可以由將每個玩家與各種動作組合相關聯的任何函數表示。在隨附的例子中,有兩個球員。一個選擇行,另一個選擇列。每個玩家都有兩種策略,這些策略由行數和列數指定。收益在內部提供。第一個數字是Row Player收到的回報(我們的示例中的播放器1);第二個是專欄播放器的回報(我們的示例中的播放器2)。假設球員1扮演,那個球員2剩下。然後,玩家1的回報為4,玩家2獲得3。

當遊戲以正常形式顯示時,假定每個玩家同時行動,或者至少在不知道對方的動作的情況下。如果玩家對其他玩家的選擇有一些信息,則遊戲通常以廣泛的形式呈現。

每個廣泛形式的遊戲都具有等效的正常遊戲,但是,對正常形式的轉換可能會導致表示形式大小的指數爆炸,從而使其在計算上是不切實際的。

特徵功能形式

在具有可移動實用程序的遊戲中,沒有給出單獨的獎勵;相反,特徵功能決定了每個統一的回報。可以這麼說的是,“空的”的團結根本不會獲得獎勵。

這種形式的起源是在約翰·馮·諾伊曼(John von Neumann)和奧斯卡·莫根斯特(Oskar Morgenstern)的書中找到的;當觀看這些情況時,他們猜測,當工會出現時,它會違背分數,就好像兩個人在玩普通遊戲一樣。 C的平衡收益是一個基本功能。儘管有不同的示例有助於確定正常遊戲的聯盟數量,但並非所有人都可以從這種功能形式出現。

正式地,特徵函數被視為:(n,v),其中n代表人群,是正常的效用。

這種特徵功能已擴展,以描述沒有可移動實用程序的遊戲。

替代遊戲表示

替代遊戲表示形式用於遊戲的某些子類或根據跨學科研究的需求進行調整。除了經典的遊戲表示外,一些替代表示形式還編碼與時間相關的方面。

姓名 方法 遊戲類型 時間
擁塞遊戲 1973 功能 n-person遊戲的子集,同時舉動
順序形式 1994 矩陣 2人遊戲不完美的信息
定時遊戲 1994 功能 兩人遊戲 是的
節日 1997 邏輯 不完美的信息遊戲
圖形遊戲 2001 圖,功能 n-person遊戲,同時動作
本地效果遊戲 2003 功能 n-person遊戲的子集,同時舉動
GDL 2005 邏輯 確定性的n-person遊戲,同時舉動
遊戲培養皿網 2006 培養皿網 確定性的n-person遊戲,同時舉動
連續遊戲 2007 功能 兩人遊戲的子集的子集 是的
PNSI 2008 培養皿網 不完美的信息遊戲 是的
動作圖遊戲 2012 圖,功能 n-person遊戲,同時動作

一般和應用用途

作為應用數學的一種方法,遊戲理論已被用來研究各種各樣的人類和動物行為。最初是在經濟學中發展的,以了解大量經濟行為,包括公司,市場和消費者的行為。遊戲理論分析的首次使用是Antoine Augustin Cournot在1838年對Cournot Dopoly的解決方案。遊戲理論在社會科學中的使用已經擴大,並且遊戲理論也應用於政治,社會學和心理行為。

儘管查爾斯·達爾文(Charles Darwin)等二十世紀前的博物學家發表了多種陳述,但在生物學中使用遊戲理論分析始於羅納德·費舍爾(Ronald Fisher )在1930年代對動物行為的研究。這項工作早於“遊戲理論”的名稱,但它與此領域共享許多重要功能。經濟學的發展隨後被約翰·梅納德·史密斯(John Maynard Smith)在1982年的《進化與遊戲理論》中應用於生物學。

除了被用來描述,預測和解釋行為外,遊戲理論還被用於發展道德或規範行為的理論並開出這種行為。在經濟學和哲學方面,學者們應用了遊戲理論來幫助理解良好或適當的行為。這種類型的遊戲理論論證可以回到柏拉圖。遊戲理論的替代版本稱為化學遊戲理論,代表玩家的選擇,就像隱喻化學反應物分子稱為“知識”。然後,化學遊戲理論將結果計算為化學反應系統的平衡解決方案。

描述和建模

一個四階段的cent遊戲

遊戲理論的主要用途是描述和建模人類人口的行為方式。一些學者認為,通過找到遊戲的平衡,他們可以預測當面對類似於研究的遊戲的情況時,實際人口的實際人群將如何行為。這種對遊戲理論的特殊觀點受到批評。有人認為,當應用於現實世界的情況時,遊戲理論家提出的假設通常會受到侵犯。遊戲理論家通常認為玩家是合理地行動的,但實際上,人類的理性和/或行為通常會偏離遊戲理論中使用的理性模型。遊戲理論家通過將其假設與物理中使用的假設進行比較來做出回應。因此,儘管他們的假設並不總是存在,但他們可以將游戲理論視為類似於物理學家使用的模型的合理科學理想。但是,經驗工作表明,在一些經典遊戲中,例如Centipede遊戲猜測平均遊戲的2/3獨裁者遊戲,人們經常不玩Nash Equilibria。關於這些實驗的重要性以及實驗的分析是否完全捕獲了相關情況的各個方面,存在著持續的辯論。

在約翰·梅納德·史密斯(John Maynard Smith)和喬治·R·普萊斯(George R. Price)的工作之後,一些遊戲理論家已轉向進化遊戲理論,以解決這些問題。這些模型認為玩家沒有合理性或有限的合理性。儘管有名字,但進化遊戲理論並不一定會假定在生物學意義上的自然選擇。進化遊戲理論既包括生物學和文化進化,也包括個人學習的模型(例如,虛擬遊戲動態)。

規定或規範分析

合作 缺點
合作 -1, -1 -10, 0
缺點 0, -10 -5, -5
囚犯的困境

一些學者將游戲理論視為人類行為的預測工具,而是人們應該如何行事的建議。由於與遊戲的NASH平衡相對應的策略是對其他玩家的行為的最佳反應- 只要他們在(同一)NASH平衡中 - 扮演NASH均衡的一部分策略似乎是合適的。遊戲理論的這種規範使用也受到批評。

在經濟學中使用遊戲理論

遊戲理論是數學經濟學和業務中用於建模相互作用代理的競爭行為的一種主要方法。應用包括各種經濟現象和方法,例如拍賣談判合併和收購定價,公平分裂雙重壟斷,寡頭壟斷社交網絡形成,基於代理的計算經濟學一般平衡,機制設計和投票系統;在諸如實驗經濟學,行為經濟學信息經濟學工業組織政治經濟學等廣泛領域。

這項研究通常著重於稱為“解決方案概念”或“均衡”的特定策略。一個普遍的假設是玩家在理性上採取行動。在非合作遊戲中,其中最著名的是納什均衡。如果每個策略都代表對其他策略的最佳響應,則一組策略是NASH平衡。如果所有球員都以NASH均衡制定了策略,那麼他們就不會單方面偏離偏差,因為他們的策略是他們所能做到的最好的策略。

遊戲的回報通常是為了代表個人玩家的實用性

關於經濟學遊戲理論的典型論文首先展示了一種是特定經濟狀況的抽象的遊戲。選擇了一個或多個解決方案概念,作者演示了介紹的遊戲中哪些策略集是適當類型的均衡。經濟學家和商業教授提出了兩種主要用途(上述):描述性規範性

在管理經濟學中的應用

遊戲理論在特定的經濟學或管理經濟學方面也有廣泛的使用。在管理經濟學領域,它的一種重要用途是分析公司之間的戰略互動。例如,公司可能在資源有限的市場中競爭,遊戲理論可以幫助管理者了解他們的決策如何影響競爭對手和整體市場成果。遊戲理論還可以用於分析公司之間的合作,例如建立戰略聯盟或合資企業。在管理經濟學中,遊戲理論的另一種用途是分析定價策略。例如,公司可能會根據他們期望競爭對手對定價決策做出回應的方式來確定最佳定價策略。總體而言,遊戲理論是在管理經濟學的背景下分析戰略互動和決策的有用工具。

遊戲理論在業務中的用途

特許採購與供應研究所(CIPS)在業務採購的背景下促進了對遊戲理論的知識和使用。 CIPS和TWS合作夥伴已經進行了一系列調查,旨在探討在採購專業人員中對遊戲理論的理解,意識和應用。他們的第三次年度調查(2019年)中的一些主要發現包括:

  • 遊戲理論在採購活動中的應用增加了 - 當時所有調查受訪者均為19%
  • 65%的參與者預測,使用遊戲理論應用程序將增長
  • 70%的受訪者說他們“只有對遊戲理論的基本或低於基本的理解”
  • 20%的參與者接受了遊戲理論的在職培訓
  • 50%的受訪者說,新的或改進的軟件解決方案是可取的
  • 90%的受訪者表示,他們沒有工作所需的軟件。

在項目管理中使用遊戲理論

明智的決策對於項目的成功至關重要。在項目管理中,遊戲理論用於建模參與者的決策過程,例如投資者,項目經理,承包商,分包商,政府和客戶。這些玩家經常會有競爭的興趣,有時他們的興趣直接不利於其他玩家,這使得項目管理方案非常適合以遊戲理論為基礎。

Piraveenan(2019)在他的評論中提供了幾個示例,其中游戲理論用於模擬項目管理方案。例如,投資者通常有多種投資選擇,每個選項可能會導致一個不同的項目,因此必須在製定項目憲章之前選擇其中一種投資選擇。同樣,例如,任何涉及分包商的大型項目,例如一個建築項目,在主要承包商(項目經理)和分包商之間或分包商本身之間都有復雜的相互作用,這些項目通常具有多個決策點。例如,如果承包商和分包商之間的合同存在歧義,則每個人都必須決定在不損害整個項目的情況下很難推動其案件,從而在其中佔有一席之地。同樣,當啟動競爭組織的項目時,營銷人員必須決定什麼是推銷項目的最佳時機和策略,或者其所得的產品或服務,以便在競爭時可以獲得最大的吸引力。在每種情況下,所需的決策都取決於其他玩家的決策,他們以某種方式對決策者的利益具有競爭利益,因此理想地可以使用遊戲理論對其進行建模。

Piraveenan總結說,兩人遊戲主要用於建模項目管理方案,並基於這些玩家的身份,在項目管理中使用了五種不同類型的遊戲。

  • 政府部門 - 私人部門遊戲(對公共私有夥伴關係建模的遊戲)
  • 承包商 - 收縮者遊戲
  • 承包商 - 合同遊戲
  • 分包商– SubContractor Games
  • 涉及其他玩家的遊戲

在遊戲類型方面,合作社以及非合件,正常形式以及廣泛形式,零-MUM以及非零和非零和UM都用於模擬各種項目管理方案。

政治學

遊戲理論在政治學上的應用集中在公平分裂政治經濟學公共選擇戰爭談判積極的政治理論社會選擇理論的重疊領域。在這些領域的每個領域中,研究人員都開發了遊戲理論模型,其中玩家通常是選民,州,特殊利益集團和政客。

安東尼·唐斯(Anthony Downs)提供了適用於政治學的遊戲理論的早期實例。他在1957年的《民主經濟理論》一書中,將熱門公司的位置模式應用於政治進程。在災難模式中,政治候選人致力於一維政策領域的意識形態。唐斯首先顯示,如果選民得到充分告知,政治候選人將如何匯聚在中位數選民首選的意識形態,但隨後辯稱選民選擇保持理性無知,這允許候選人分歧。在約翰·肯尼迪(John F. Kennedy)擔任總統期間,1962年將游戲理論應用於古巴導彈危機

還提出,遊戲理論解釋了任何形式的政治政府的穩定性。例如,以君主制最簡單的案例,國王只有一個人,沒有也不能通過親自對全部甚至任何大量臣民行使身體的控制來維護其權威。相反,每個公民的認可表明,所有其他公民都希望彼此認為國王(或其他已建立的政府)是遵守命令的人。有效地禁止協調公民之間的溝通以取代君主,因為串謀替換主權者通常被判處犯罪。因此,在可以由囚犯困境的變體模擬的過程中,在穩定時期,任何公民都會發現,即使所有公民都知道,如果他們全部採取行動,他們會更好,即使他們會更好集體。

民主和平的遊戲理論解釋是,民主國家的公眾和公開辯論向其他州發送了有關其意圖的明確而可靠的信息。相比之下,很難知道非民主領導人的意圖,將會有什麼影響,以及是否要保證。因此,如果至少有爭議中的當事方是非民主的,那麼不信任和不願做出讓步。

但是,遊戲理論預測,即使他們的領導人意識到戰鬥成本,兩個國家也可能仍在戰爭中。戰爭可能是由不對稱信息引起的;兩個國家可能會激勵措施誤解他們手頭的軍事資源數量,使他們在不訴諸戰鬥的情況下無法達成一致解決爭議。此外,戰爭可能是由於承諾問題而出現的:如果兩個國家希望通過和平手段解決爭端,但是每個國家都希望回到該和解的條款,那麼他們可能別無選擇,只能訴諸戰爭。最後,戰爭可能是由於問題不足而引起的。

當有新的規則或法律適用於該國家時,遊戲理論還可以幫助預測一個國家的回應。彼得·約翰·伍德(Peter John Wood)(2013)的研究是一個例子,研究了國家可以採取什麼行動來幫助減少氣候變化。伍德認為這可以通過與其他國家簽訂條約來減少溫室氣體排放來實現。但是,他得出的結論是,這個想法無法奏效,因為這將為各國造成囚犯的困境。

在國防科學技術中使用遊戲理論

遊戲理論已廣泛用於建模與國防應用相關的決策情況。在國防環境中應用遊戲理論的大多數研究都與指揮和控制戰有關,並且可以進一步分類為與(i)資源分配戰爭(ii)信息戰(iii)武器控制戰爭和(iv)對抗的研究監視戰爭。研究的許多問題都與感應和跟踪有關,例如,一艘試圖追踪敵對潛艇和試圖追踪追踪的潛艇的地面船,以及有關軸承,速度和傳感器的相互依存決策兩艘船隻激活的技術。 Ho等人就使用遊戲理論在國防應用中使用遊戲理論提供了最先進的摘要,並在被考慮的情況下強調了遊戲理論的好處和局限性。

在生物學中使用遊戲理論

鴿子
20, 20 80, 40
鴿子 40, 80 60, 60
鷹派遊戲

與經濟學的人不同,生物學遊戲的回報通常被解釋為與健身相對應。此外,重點不太在於平衡,這與合理性的概念相對應,而更多地是在進化力量所維持的概念上。生物學中最著名的平衡被稱為進化穩定策略(ESS),首次引入( Maynard Smith&Price 1973 )。儘管其最初的動機並不涉及NASH平衡的任何心理要求,但每個ESS都是NASH平衡。

在生物學中,遊戲理論已被用作了解許多不同現象的模型。它首先用來解釋大約1:1性別比例的演變(和穩定性)。 ( Fisher 1930 )建議1:1性別比例是作用於可以被視為試圖最大化其孫子數量的個體的進化力量的結果。

此外,生物學家還使用了進化遊戲理論和ESS來解釋動物交流的出現。對信號遊戲其他通信游戲的分析為動物之間交流的演變提供了深入的了解。例如,許多物種的動員行為,其中大量獵物攻擊較大的捕食者似乎是自發性新興組織的一個例子。還顯示螞蟻表現出類似於時尚的前進行為(請參閱Paul Ormerod蝴蝶經濟學)。

生物學家使用雞肉來分析戰鬥行為和領土。

根據梅納德·史密斯(Maynard Smith)的說法,在進化論和遊戲理論的序言中,“矛盾的是,事實證明,遊戲理論比最初設計的經濟行為領域更容易應用於生物學”。進化遊戲理論已被用來解釋自然界中許多看似不協調的現象。

一種這種現像被稱為生物利他主義。在這種情況下,有機體似乎以使其他生物體受益並對其自身有害的方式作用。這與傳統的利他主義概念不同,因為這種行動不是有意識的,而是進化適應性以提高整體適應性。可以在物種中找到例子,從吸血鬼蝙蝠,這些吸血鬼蝙蝠反流從夜間狩獵中獲得的血液,並將其送給未能餵養的小組成員,到那些一生都照顧女王蜜蜂的蜜蜂,從不交配,從不交配,再到。 Vervet Monkeys警告群體成員採取捕食者的方法,即使它危害了個人生存的機會。所有這些動作都會增加一個小組的整體適應性,但要付出代價。

進化遊戲理論用親屬選擇的想法解釋了這種利他主義。利他主義者歧視他們幫助的個人和偏愛親戚。漢密爾頓的規則解釋了與方程式C <b×R背後的進化原理,其中成本c對利他主義者的c必須小於接收者的收益b乘以相關性r的係數。更緊密的兩個生物是導致利他主義的發生率增加,因為它們具有許多相同的等位基因。這意味著,通過確保其近親的等位基因通過其後代的生存傳遞,可以放棄具有後代本身的選擇,因為相同數量的等位基因被傳遞。例如,幫助兄弟姐妹(在二倍體動物中)的係數為1⁄2 因為(平均而言)一個人在兄弟姐妹的後代中分享了一半的等位基因。確保足夠多的兄弟姐妹的後代能夠生存以成年,這阻礙了利他主義個人產生後代的必要性。係數值在很大程度上取決於競爭環的範圍;例如,如果選擇誰包括所有遺傳生物,而不僅僅是所有親戚,我們假設所有人類之間的差異僅佔運動環境中多樣性的1%,這是一個係數,該係數1⁄2較小的場變為0.995。同樣,如果考慮到除遺傳性質(例如表觀遺傳學,宗教,科學等)以外的信息,隨著時間的流逝,競爭環境會持續更大,並且差異較小。

計算機科學和邏輯

遊戲理論在邏輯計算機科學中起著越來越重要的作用。幾種邏輯理論在遊戲語義上有基礎。此外,計算機科學家還使用遊戲來建模交互式計算。此外,遊戲理論為多代理系統領域提供了理論基礎。

另外,遊戲理論在在線算法中發揮了作用。特別是, K -Server問題過去被稱為帶有移動成本請求答案遊戲的遊戲。 Yao的原則是一種遊戲理論技術,用於證明隨機算法計算複雜性尤其是在線算法的計算複雜性。

互聯網的興起激發了在遊戲,市場,計算拍賣,點對點系統以及安全和信息市場中尋找平衡的算法的發展。算法遊戲理論及其內部算法機制設計結合了對複雜系統的計算算法設計和經濟理論的分析。

哲學

野兔
3, 3 0, 2
野兔 2, 0 2, 2
雄鹿狩獵

遊戲理論已在哲學中使用了幾種用途。劉易斯( 1960,1967 )回應了Wvo Quine1960,1967 )的兩篇論文,使用了遊戲理論來開發對慣例的哲學敘述。這樣,他提供了對常識的首次分析,並將其用於分析協調遊戲中的遊戲。此外,他首先建議人們在信號遊戲方面可以理解含義。自劉易斯以來,幾位哲學家一直在提出這一建議。遵循劉易斯(1969)的遊戲理論敘述,Edna Ullmann-Margalit(1977)和Bicchieri (2006)開發了社會規範的理論,這些理論將其定義為NASH均衡,這是由於將混合動力遊戲轉變為協調遊戲而導致的。

遊戲理論還挑戰了哲學家在互動認識論方面思考:集體擁有共同的信念或知識的含義,以及這種知識對代理人互動產生的社會成果的後果是什麼。在這一領域工作的哲學家包括Bicchieri(1989,1993), Skyrms (1990)和Stalnaker (1999)。

道德上,一些作者(最著名的是戴維·高迪耶(David Gauthier),格雷戈里·卡夫卡(Gregory Kavka)和讓·漢普頓(Jean Hampton))的作者試圖追求托馬斯·霍布斯( Thomas Hobbes )從自私自利中獲得道德的項目。由於像囚犯的困境這樣的遊戲在道德與自身利益之間顯然存在衝突,因此解釋了為什麼自身利益要求合作是該項目的重要組成部分。這種一般策略是政治哲學中一般社會契約觀點的組成部分(例如,請參見Gauthier(1986)Kavka(1986) )。

其他作者試圖使用進化遊戲理論,以解釋人類對道德和相應動物行為的態度的出現。這些作者研究了幾種遊戲,包括囚犯的困境,塔格·亨特( Stag Hunt )和納什(Nash)討價還價遊戲,以解釋出現關於道德的態度的解釋(參見,例如,例如,Skyrms( 1996, 2004 )和Sober and Wilson( 1998 ))。

零售和消費產品定價

遊戲理論應用通常用於零售和消費市場的定價策略中,特別是用於銷售非彈性商品。隨著零售商不斷爭奪消費者市場份額的競爭,零售商間歇性地打折某些商品已成為一種相當普遍的做法,希望增加磚和砂漿地點的足跡(網站訪問電子商務零售商的網站訪問)或增加輔助或免費產品的銷售。

黑色星期五是美國一個受歡迎的購物假期,當時許多零售商專注於捕捉假日購物市場的最佳定價策略。在黑色星期五的情況下,使用遊戲理論應用程序的零售商通常會問“主要的競爭對手對我的反應是什麼?”在這種情況下,遊戲有兩個玩家:零售商和消費者。零售商專注於最佳定價策略,而消費者則專注於最好的交易。在這個封閉的系統中,通常沒有主要的策略,因為兩個玩家都有其他選擇。也就是說,零售商可以找到不同的客戶,消費者可以在另一家零售商購物。但是,鑑於當天的市場競爭,零售商的主要戰略在於表現優於競爭者。開放系統假設多家零售商出售類似商品,並且以最佳價格要求商品的消費者數量有限。康奈爾大學教授的博客提供了這樣一種策略的例子,當時亞馬遜為三星電視台定價低於零售價值的100美元,從而有效地削弱了競爭對手。亞馬遜通過提高HDMI電纜的價格來構成差異的一部分,因為發現在銷售次要物品時,消費者的價格歧視性較小。

在定價消費品時,零售市場繼續發展遊戲理論的策略和應用。在受控環境和現實世界中的模擬之間發現的關鍵見解表明,此類策略的應用更為複雜,因為每個零售商都必須在定價供應商關係品牌形象蠶食潛力之間找到最佳的平衡出售更多有利可圖的物品。

流行病學

由於通常由個人做出疫苗的決定是由個人做出的,他們可能會考慮做出這一決定的一系列因素和參數(例如疾病的發病率和患病率,可感知和與疾病的實際風險,死亡率,與疫苗接種相關的可感知和實際風險以及疫苗接種的經濟成本),遊戲理論已被用來建模和預測社會中的疫苗接種吸收。

人工智能和機器學習

遊戲理論在AI/ML領域具有多個應用。它通常用於開發可以在不確定環境中做出複雜決策的自主系統。遊戲理論在AI/ML上下文中的其他一些領域如下 - 多代理系統形成,增強學習,機制設計等。通過使用遊戲理論來對其他代理的行為進行建模並預測其行為,AI/ML系統可以做出更好的決策並更有效地運作。

眾所周知的遊戲示例

囚犯的困境

標準囚犯的困境回報矩陣
B
A
b留下來 bbetrays
一個留下來
−2
−2
0
−10
Abetrays
−10
0
−5
−5

威廉·龐德斯通(William Poundstone)在1993年的《囚犯的困境》中描述了這場比賽:

犯罪團伙A和B的兩名成員被捕和監禁。每個囚犯都被單獨監禁,沒有與伴侶進行交流。主要指控將導致判處十年徒刑;但是,警察沒有定罪的證據。他們計劃以較少的指控判處兩年徒刑,但為每個囚犯提供浮士德的討價還價:如果其中一個承認委託人的罪行,背叛了另一個罪行,他們將被赦免並自由離開而另一個必須為整個句子服務,而不必僅僅兩年才能獲得較少的指控。

主要的策略(因此,對任何可能的對手策略的最佳反應)是背叛對方,這與確定的原則保持一致。但是,兩名囚犯保持沉默將為他們倆帶來比相互背叛更大的回報。

性別之戰

“性戰鬥”是一個術語,用於描述生活的各個領域(例如人際關係,職業和社會角色)中男女之間的衝突。這種衝突經常在流行文化中描繪,例如電影和電視節目,是性別之間的幽默或戲劇性的競爭。這種衝突可以在遊戲理論框架中描繪。這是非合作遊戲的一個例子。

在流行媒體的關係的描繪中,可以看到“性別之戰”的一個例子,在這個人際關係中,男人和女人通常被描述為從根本上不同,彼此之間存在衝突。例如,在一些浪漫的喜劇中,男性和女性主角被證明是對愛情和人際關係的相反觀點,他們必須克服這些差異才能在一起。

在這個遊戲中,有兩個純粹的策略納什平衡,兩個玩家都選擇相同的策略,另一個玩家選擇不同的選項。如果遊戲以混合策略的方式進行,每個玩家都會隨機選擇自己的策略,那麼納什均衡數量無限。但是,在“性別之戰”遊戲的背景下,通常認為該遊戲是以純粹的策略進行的。

最後通遊戲

最後通atum遊戲是一款已成為經濟實驗的流行工具。早期的描述是諾貝爾獎獲得者約翰·哈薩尼(John Harsanyi)在1961年。

一位球員,提議者,擁有一筆錢。提議者的任務是將其與另一個玩家,響應者分開(誰知道總和是多少)。一旦提議者傳達了他的決定,響應者就​​可以接受或拒絕。如果響應者接受,則根據提案分配錢;如果響應者拒絕,則兩位球員都不會收到。兩位球員事先知道接受或拒絕要約的響應者的後果。該遊戲展示了社會接受,公平和慷慨如何影響玩家的決策。

Ultimatum遊戲具有一個變體,即獨裁者遊戲。它們幾乎是相同的,除了在獨裁者遊戲中,響應者無權拒絕提議者的提議。

信任遊戲

信任遊戲是一個旨在衡量經濟決策的信任的實驗。它也被稱為“投資遊戲”,旨在調查信任並證明其重要性,而不是自我利益的“理性”。該遊戲是由Berg Joyce,John Dickhaut和Kevin McCabe於1995年設計的。

在遊戲中,一個玩家(投資者)獲得了一筆錢,必須決定給另一個玩家(受託人)多少錢。然後,實驗者將給定的數量增加了兩倍。然後,受託人決定將三倍的金額返回投資者。如果收件人完全自我感興趣,那麼他/她不應該退還。但是,這不是事實,因為實驗進行了。結果表明,人們願意通過危險一些錢來建立信任,因為他們相信會有互惠。

庫諾特競賽

Cournot競爭模型涉及玩家選擇數量的同質產品來同時獨立生產,在該產品中,每個公司的邊際成本可能會有所不同,而公司的回報是利潤。生產成本是公共信息,該公司的目標是根據他們認為另一家公司會產生和行為的壟斷地找到其利潤最大化的數量。在這個遊戲中,公司希望以壟斷數量生產,但有很高的動力來偏離和生產更多,從而降低了市場清算價格。例如,如果壟斷量低和價格較低,則可能會傾向於偏離壟斷數量,以增加生產以最大化利潤。但是,由於公司最大化利潤的能力取決於其市場份額和市場需求的彈性,因此此期權無法提供最高的收益。當每個公司都在反應功能上運作時,就達到了庫諾特的均衡,而無需偏離動力,因為它們根據其他公司的產量具有最佳的響應。在遊戲中,當達到庫諾特均衡時,公司達到了納什均衡。

歐文諾數競賽的平衡

伯特蘭比賽

Bertrand競賽假設了同質產品和持續的邊際成本,並且玩家選擇了價格。價格競爭的平衡是價格等於邊際成本的地方,假設有關競爭對手的成本的完整信息。因此,公司有動力偏離均衡,因為價格較低的同質產品將獲得所有市場份額,稱為成本優勢。

在流行文化中

  • 基於Sylvia Nasar1998年書籍,遊戲理論家和數學家John Nash的生活故事變成了2001年傳記片Russell Crowe主演納什(Nash)。
  • 羅伯特·A·海因萊因( Robert A. Heinlein)的1959年軍事科幻小說小說《星際飛船》(Starship Troopers)提到了“遊戲理論”和“遊戲理論”。在1997年的同名電影中,角色卡爾·詹金斯(Carl Jenkins)將他的軍事情報任務稱為“遊戲與理論”。
  • 1964年的電影《 Strangelove博士》諷刺了有關威懾理論的理論觀念。例如,如果檢測到核攻擊,核威懾取決於對災難性報復的威脅。遊戲理論家可能會爭辯說,從某種意義上說,這種威脅可能會導致子遊戲不完美的平衡。這部電影將這一想法進一步邁進了一步,蘇聯不可撤銷地致力於災難性的核反應,而不會公開威脅。
  • 1980年代的Power Pop樂隊遊戲理論是由歌手/詞曲作者Scott Miller創立的,他將樂隊的名字描述為“計算最適合的動作的研究,鑑於對手 ...給自己最小的失敗量”。
  • 騙子遊戲是2005年的日本漫畫和2007年電視連續劇,每個情節中的主要角色都有一個通常是從遊戲理論中汲取的遊戲或問題,如角色所採用的策略所證明的那樣。
  • 1974年的小說《間諜故事》Len Deighton)探索了關於冷戰軍事演習的遊戲理論元素。
  • Liu Cixin的2008年小說《黑暗森林》探討了外星人生活,人類和遊戲理論之間的關係。
  • 電影中的主要對手小丑《黑闇騎士》提出了遊戲理論的概念,這無疑是囚犯在一個場景中,他要求兩種不同的渡輪的乘客轟炸另一個乘客以拯救自己的困境。
  • 在2018年的電影《瘋狂的富人亞洲人》中,女主角瑞秋(Rachel Chu)是紐約大學經濟學與遊戲理論教授。在電影的開頭,她在紐約大學教室裡看到了與她的助教玩撲克遊戲,並通過虛張聲勢贏得了比賽。然後,在電影的高潮中,她與男友不贊成的母親埃莉諾(Eleanor)一起玩了一場馬翁( Mahjong) ,他故意將比賽輸給了埃莉諾(Eleanor),但因此贏得了自己的認可。
  • 在2017年的電影莫莉(Molly)的比賽中,沒有經驗的撲克玩家布拉德(Brad)做出了一個不合理的博彩決定,而沒有意識到,並使對手哈蘭(Harlan)偏離了納什均衡策略,當哈蘭(Harlan)失去手時,造成了重大損失。

也可以看看

列表