博弈论简介
博弈论(game theory)是经济学的一个分支,主要研究具有竞争或对抗性质的个体,在特定规则下所产生的各种行为。博弈论关注博弈中个体的预期行为与实际行为,并研究其最优策略。
通俗地讲,博弈论主要研究的是:在一个游戏中,进行游戏的多位玩家如何选择策略。
基础概念
本节将简要介绍博弈论中的一些常见概念。
合作/非合作博弈
合作博弈(cooperative game)是指参与者可以结成联盟、相互合作的博弈。在这类博弈中,个体的不合作行为往往会受到某种外部机制的惩罚。与之相对,非合作博弈(noncooperative game)中并不存在这样的机制,因此,参与者要么无法结成联盟,要么只能依赖可信的威胁机制维持合作。
相比合作博弈,非合作博弈的研究更为系统和成熟。本文讨论的所有博弈均为非合作博弈。
对称/非对称博弈
在 对称博弈(symmetric game)中,不同参与者在做出相同行为时获得的收益是相同的,也就是说,收益只取决于行为本身,而与行为者的身份无关。不满足这一条件的博弈称为 非对称博弈(asymmetric game)。
零和/非零和博弈
零和博弈(zero-sum game)指的是无论各方采取何种行为,所有参与者的收益总和始终为零。通常讨论的零和博弈涉及两名参与者,此时,一方的收益必然是另一方的损失。相对地,非零和博弈(non-zero-sum game)允许多方共赢或共输,包括 正和博弈(positive-sum game)和 负和博弈(negative-sum game)等。
同时/序贯博弈
在 同时博弈(simulatenous game)中,所有参与者在不知道他人选择的前提下同时做出决策。例如剪刀石头布就是一个典型的同时博弈。这类博弈常用收益矩阵表示,并通常不涉及时间的概念。
与此相对的是 序贯博弈(sequential game),即参与者依次行动。需要注意的是,后行动者至少能够观察到部分先行动者的行为,否则先后顺序将毫无意义。序贯博弈通常借助博弈树来刻画。
完美/不完美信息博弈
完美信息(perfect information)指参与者在任意时刻做出决策时,完全了解此前所有事件的发生情况,包括游戏初始状态。例如象棋、围棋等属于完美信息博弈;而麻将、扑克则是不完美信息博弈,因为玩家无法获知他人的手牌。完美信息通常用于描述序贯博弈;由于在同时博弈中玩家彼此无法得知对方即将采取的行动,因此通常认为同时博弈不是完美信息博弈。
完全/不完全信息博弈
完全信息(complete information)是指所有参与者对博弈结构本身(包括各方可选决策和最终收益)有完全了解,且这些信息为公共知识(common knowledge)。与之相对的是不完全信息博弈,其中某些博弈要素(如对手的可选决策或收益函数)对参与者来说是未知的。
值得注意的是,「完全信息」和「完美信息」是两个独立概念,互不包含。例如,麻将是一种完全信息但不完美信息的博弈,因其规则和收益是公开的,但牌面信息并不透明;而某些具有隐藏目标、但行为全程公开的游戏,则属于完美信息但不完全信息的博弈。
组合博弈论
在算法竞赛中,最常见的博弈类型是 组合博弈(combinatorial game)。该术语通常指那些因状态数量巨大而难以求解的博弈。正因为一般的组合博弈相当复杂,组合博弈论主要关注以下类型:两人轮流行动的、完美信息、无随机因素的博弈。象棋、围棋等都是典型的组合博弈。
公平组合博弈
主页面:公平组合博弈
公平博弈(impartial game)指满足如下条件的组合博弈:
- 在任意确定状态下,所有参与者可选择的行动完全相同,仅取决于当前状态,与身份无关;
- 博弈中的同一个状态不可能多次抵达,博弈以参与者无法行动为结束,且博弈一定会在有限步后以非平局结束。
公平博弈总是对称博弈。
非公平组合博弈
主页面:非公平组合博弈
与公平博弈相对的概念是 非公平博弈(partizan game),即参与者在某一状态下可采取的行动依赖其身份。大多数棋类游戏(如国际象棋、中国象棋、围棋、五子棋等)都是非公平博弈,因为参与者只能操作自己的棋子。
正常/反常博弈
组合博弈中,通常的胜利者是博弈结束前,最后一名采取行动的参与者。这称为 正常博弈(normal game)。与之相对应的是 反常博弈(misère game),即博弈结束前,最后一名采取行动的参与者是失败者。
公平和非公平组合博弈都可以是正常或反常博弈。
参考资料
- Game theory - Wikipedia
- Combinatorial game theory - Wikipedia
- Impartial game - Wikipedia
- Misère - Wikipedia
本页面最近更新:2025/8/7 22:55:56,更新历史
发现错误?想一起完善? 在 GitHub 上编辑此页!
本页面贡献者:Backl1ght, c-forrest, woruo27, cutekibry, Tiphereth-A
本页面的全部内容在 CC BY-SA 4.0 和 SATA 协议之条款下提供,附加条款亦可能应用