字词 | 囚徒困境 |
类别 | 中英文字词句释义及详细解析 |
释义 | 囚徒困境prisoner’s dilemma博弈论的经典案例。假设两个嫌疑犯被分别审讯。下表给出囚徒困境的战略式表述。这里每个囚徒都有两种战略: 坦白或抵赖。表中每一格的两个数字代表对应战略组合下两个囚徒的支付 (效用),其中第一个数字是第一个囚徒的支付,第二个数字是第二个囚徒的支付。这使每个嫌疑犯面临四个可能的后果:获释(自己坦白同伙抵赖); 被判刑一年 (两人都抵赖); 被判刑8年(两人都坦白); 被判刑10年 (自己抵赖同伙坦白)。这就是囚徒的困境。在这个博弈里,每个囚犯都有两种可选择的战略: 坦白或抵赖。显然不论同伙选择什么战略,每个囚徒的最优战略是坦白,坦白是两人共同的最优策略。这里的 (坦白,坦白)是一个纳什均衡,尽管两人都抵赖的结果优于两人都坦白,但这个帕累托改进办不到,因为它不满足个人理性的要求。囚徒困境反映了一个很深刻的问题,这就是个人理性和集体理性之间的矛盾。 囚徒困境Prisoner Dilemma反映个人最佳选择并非团体最佳选择的策略。博弈论的非零和博弈中最具代表性的例子。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。经典的囚徒困境如下:两名囚徒面临如下选择,若两人都保持沉默,则两人都将服刑半年;若两人中其中一人认罪并检控对方,则认罪的一方获释,另外一人服刑10年;若两人都认罪并互相检控,则两人均服刑2年。囚徒们虽然可以通过彼此合作、拒不认罪为全体带来最佳利益,但在信息不明的情况下,因为出卖对方可为自己带来利益,也因为对方把自己出卖可为对方带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己的最优选择。但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外的因素(出卖同伙会受到报复等),而无法完全以执法者所设立的利益(刑期)作考量。 囚徒困境博弈论中用以说明合作博弈与非合作博弈的经典例子。犯罪嫌疑人甲和乙共同作案后被警察抓住,警察缺乏充分的证据对他们进行指控,因此需要他们相互提供彼此犯罪的证据。警察将他们分别关在不同的房间内进行审讯。警察告诉他们: 如果两人都坦白,各判刑2年(表中右下角单元);如果两人都抵赖,因证据不足,各判刑1年(表中左上角单元);如果一个坦白,一个抵赖,坦白者从宽释放,抵赖者从严判刑4年(表中左下角或右上角单元)。表中描述的这个博弈中,每个参与者都有两种行动选择: 坦白或抵赖。两个参与者同时选择他们的行动,因此是一个完全信息静态博弈。表中每一格的两个数字代表对应的行动组合下两个嫌疑人的收益(判刑是负收益),第一个数字代表甲的收益,第二个数字代表乙的收益。 尽管对双方来说,都抵赖(合作)的结果比都坦白(不合作)的结果要好,但是自利动机使两人均不会选择抵赖。在乙选择坦白时,甲的最优策略是坦白;在乙选择抵赖时,甲的最优策略也是坦白。即不管乙如何行动,甲的最优策略均为坦白,相应地甲会选择坦白。乙面临的情况和甲完全一样,所以乙的最优策略也是坦白,相应地乙也会选择坦白。因此,这个博弈的纳什均衡是(坦白,坦白)。这个博弈的关键是,每个嫌疑人均为理性的自利主义者。实际上这也是博弈论的基本假设。囚徒困境反映了一个深刻的问题,这就是个人理性和集体理性的矛盾。它意味着个人理性并不是实现集体理性的充分条件。尽管双方都抵赖的结果明显比都坦白好,但是这个结果得不到,因为它不满足个人理性要求,尽管它是集体理性的。实际上,即使双方在被审讯之前达成了合作协议,都选择抵赖,这个协议也不会被遵守。因为遵守协议不符合个人利益,理性的自利主义者不会遵守协议。 囚徒困境 囚徒困境Prisoner’s Dilemma是首先由塔克 (Tucker,A) 提出的一个博弈论问题,它揭示了个人理性与集体理性可能存在矛盾。观察图A,假定有囚徒甲乙两人,如果双方均抵赖所犯罪行 (D,D),则将各被判入狱1年; 如果均坦白 (C,C),则将各被判入狱5年; 如果一方抵赖另一方坦白 [ (C,D)或(D,C)],则坦白者无罪而抵赖者入狱20年。结果囚徒甲和乙均将选择坦白,这是因为如果对手选择抵赖,那么另一方选择坦白和抵赖时分别被判释放和入狱1年; 如果对手选择坦白,那么另一方选择坦白和抵赖时分别被判入狱5年和20年。无论对手采取何种态度,另一方的占优战略总是坦白,结果囚徒博弈的纳什均衡 (Nash Equilibrium) 是 (坦白,坦白) 而不是 (抵赖,抵赖) (Morton,D.,1973)。图D中 (C,C) 不再是占优战略,但却是一个稳定的纳什均衡,因为如果对手无意中犯下错误选择时,该扰动将不会动摇最终的博弈结果,假定对手犯错误的可能是μ(即该囚徒以1-μ的概率选择坦白,错误地选择抵赖的概率为μ),那么另一囚徒在抵赖时的支付函数期望为 (-10)×(1-μ); 在坦白时的支付函数期望为-μ+(-5)×(1-μ)。结果只要对手犯错误的概率μ≤5/6,囚徒的最优选择总是坦白。囚徒困境对传统经济学的微观基础构成了重大的挑战,因为斯密(Smith,A,1974) 认为: 人类的行为有六种动机,自爱、同情、追求自由和欲望、正义感、劳动和交换习惯。推动人类进步的主要力量是自私利己的动机,以个人效用极大化为目标的个人理性指引人类努力劳动并导致经济繁荣和社会福利极大化的结果。“斯密有一项及其重要的贡献,他把在竞争条件下,个人追求私利的行为的系统分析,置于经济学的中心地位。这个理论是 《国富论》 王冠上的宝石,它成了 (而且至今仍然是) 资源分配理论的基础(Stigler,J.,1976)”。但是囚徒困境的结果表明个人理性不能通过市场导致社会福利的最优。 图A 图B 图C 图D ☚ 纳什均衡 大推进理论 ☛ 囚徒困境 囚徒困境prisoner's dilemma博弈论经典例子。最早由美国普林斯顿大学数学家曾克1950年提出。假设两个嫌疑犯作案后被警察抓住,隔离审讯,如果两人都坦白则各判八年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判一年。单次发生的囚徒困境和多次重复的囚徒困境结果不会一样。在重复的囚徒困境中,博弈被反复地进行,因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为,这时,欺骗的动机可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。囚徒困境的主旨为,囚徒们如果彼此合作,坚不吐实,可为全体带来最佳利益,但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为同伙带来利益,因此彼此出卖虽违反最佳共同利益,但这反而是自己最大利益所在。但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。 ☚ 选择比较水平 个体社会心理 ☛ 囚徒困境 囚徒困境亦称“囚犯两难博弈”。一种用于研究利益冲突情景下人们如何作出选择的实验情境。在该实验设计的双人游戏情境中,有合作策略C和背叛策略D供选择,无论对方是选C还是选D,选D的报酬总是比选C高,但是双方同时都选C所得到的报酬却高于双方同时选D时。 ☚ 冲突 代际冲突 ☛ |
随便看 |
|
文网收录3541549条中英文词条,其功能与新华字典、现代汉语词典、牛津高阶英汉词典等各类中英文词典类似,基本涵盖了全部常用中英文字词句的读音、释义及用法,是语言学习和写作的有利工具。