被设计的“囚徒困境”

admin · 发表于 2007-1-26 13:09:50

注册后推荐绑定QQ，之后方才可以使用下方的“用QQ帐号登录”。

您需要登录才可以下载或查看，没有账号？立即注册

x

http://blog.sina.com.cn/u/4a8acae301000660

　　囚徒困境并不像我们想象的那么糟糕，因为它可以作为一个大博弈的小博弈被设计出来，并为设计者带来好处。

■／董志强

一
　　伟大的学者，都善于讲故事，无论他来自哪个领域。塔克(A.W.Tucker)，一个数学家，在1950年向心理学家讲了一个小故事，以后这个故事一直被经济学家和其他社会科学家重复，并最终对20世纪后半页的社会科学产身了至深影响。
　　这个故事，名叫“囚徒困境”（尚不知道囚徒困境为何物的读者，有必要先阅读本文附录，再回头来接着读）。多年来，很多的著作讨论了囚徒困境中个人理性和集体理性的冲突——每个个体从完全利己出发做出的决策，结果使每个个体都遭殃。因此，在很多人看来，囚徒困境是人类社会一个非常糟糕的问题，人们也常常为如何走出囚徒困境而殚精竭虑。
　　囚徒困境真的对社会就那么糟糕吗？如果单独考察囚徒困境，从两个囚徒出发，答案是肯定的。但是，如果我们将囚徒困境置放在一个更大的博弈背景下，则答案可能是否定的。至少，警察利用囚徒困境提高了破案效率，这对社会是一个福音。
　　不单如此，在一个社会中，充满了很多的博弈。一个博弈，也许只是镶嵌在一个更大的博弈中的小博弈而已。此时，要单独分析这个小博弈，就有必要看一看我们能在多大的程度上将这个小博弈从大博弈中孤立出来。如果很难将这个小博弈孤立出来，那么对这个小博弈的分析就必须放在那个大博弈的背景下来进行。一旦认识到这一点，我们将会发现在很多时候，囚徒困境并不像我们想象的那么糟糕，因为它可以作为一个大博弈的小博弈被设计出来，并为设计者带来好处。下面就是几个设计者通过囚徒困境谋取好处的例子。

二
　　第一个例子来自商业领域。假设你是一家公司的采购人员，正决定向两家供应商采购100万只配件。每只配件的生产成本为6元钱。如果你分别向两家供应商各订购50万只，则每个供应商就会把价格定在10元，从而每个供应商将获利50×(10-6)=200万元，而你自己的支出是100×10=1000万元。此时你可以宣布一个政策在两家供应商之间制造出囚徒困境，从而给自己带来好处。政策是这样的：(1)如果价格在10元，则向两家供应商各订购50万件；(2)如果一家把价格降到8.5元，而另一家保持在10元，则100万件订单全部给低价的供应商；(3)如果两家都把价格降到8.5元，则仍向两家各自订购50万件。

图1 供应商的囚徒困境
　　　　　　　　　　　　供应商乙
　　　　　　　　　　　8.5元　　　　10元
供应商甲　　8.5元　125，125 　250，0
　　　　　　10元　　0，250 　　200，200

　　这样的情况下，简单计算可以发现，如果两个供应商都不降价，则各自获利50×(10-6)=200万元；如果都降价，则各自获利50×(8.5-6)=125万元；如果一个降价一个不降价，那么降价者获利100×(8.5-6)=250万元，而不降价者得到0元。这就在两个供应商中造成了囚徒困境（图1）
　　图1中，不难发现两供应商都选择8.5元是唯一的纳什均衡。因为供应商甲是这样盘算的：如果乙定10元，则我最好定8.5元（得到250万）而不是定10元（只得到200万）；如果乙定8.5元，我最好还是定8.5元（得到125万）而不是定10元（只得到0万）；因此，无论乙怎么定价，我定8.5元始终是最优的。反过来，供应商乙心理的小算盘跟甲是一样的，无论甲如何选择，8.5元对乙也是最优的。结果，两人都选择8.5元是均衡的结果。
　　而此时，你付出的总的订购本是多少？100×8.5=850万元，节约了150万元。
当然，我们要提醒，这样的机制只是在非重复博弈情况下有用（因为足够长期的重复博弈中两个供应商可以合谋不降价），尤其是当你告诉供应商这笔合同机会只有一次的时候，每个供应商迫不及待为了抓住仅有的一次机会，而不得不就范。

三
　　第二个例子来自监管领域。众所周知，上市公司与审计机构合谋是当代公司治理中的一个严重问题。有时候，我们可以通过在两名审计机构之间构造囚徒困境来防范合谋。
　　假设现在要对一家上市公司进行审计。审计技术是完美的，即审计机构一定能发现上市公司有没有违规行为。如果上市公司有违规行为，而被审计机构查出，这时公司管理层就有动机收买审计机构，让审计机构不要报告其违规行为。假设管理层收买审计机构的最高代价可达到1万元，那么为了激励审计机构如实报告，可实施如下的一种机制：(1)如果报告“上市公司未违规”，则支付奖金0元；(2)如果报告“上市公司未违规”，则支付奖金1.1万元。显然，这样的机制下审计机构若发现上市公司有违规行为，他会如实汇报，因为他如实汇报得到奖金1.1万元比他和上市公司合谋得到贿金1万元更多。
　　但是，这里支付给审计机构的奖金可能太高了（超过代理人过失的代价）。如果我们雇佣两名审计机构来进行审计，在完美审计条件下，审计机构甲谎报而审计机构乙如实报告违规，那么就可以肯定审计机构甲说谎。则设计如下一个囚徒困境机制就可以防止审计合谋，而且成本低廉：(1)如果两个审计机构都谎报，则都只能得到奖金0；但他们将分享上市公司贿金，各得0.5万元；(2)如果两个审计都诚实回报，则各自只能得到奖金0元；并且得不到贿金。最后各自赢利总和0元；(3)如果一个诚实报告而一个谎报（交叉验证报告可发现谎报者），则对诚实报告者奖励0.55万元，对谎报者罚款1.1万元；但谎报者获得了1万元贿金；这样的情况下诚实报告者净赢利仅仅是奖金0.55万元，而谎报者的净赢利是-0.1万元。

图2. 阻止审计合谋的囚徒困境
　　　　　　　　　　　　　　审计机构乙
　　　　　　　　　　　　　谎报　　　实报
审计机构甲　　谎报　0.5，0.5 　-0.1，0.55
　　　　　　　　实报 0.55，-0.1 　0，0

　　从图2可发现，这样的一个机制下，实报始终是每一个审计机构的优势策略。因为给定对方谎报，则自己谎报得到0.5万，实报却可以得到0.55万；若对方实报，则自己谎报得到-0.1万，而实报得到0万也比-0.1万好。每个审计机构都会选择实报。
　　现在来看，我们的这个机制究竟要花多大的代价呢？代价是0！因为最后是两个审计机构都如实汇报，都得到0奖金。也许唯一的代价就是要支付两个审计机构的工资而已。比起前一个要花费奖金1.1万的机制，这个机制就廉价多了。
　　当然，仍需说明，我们这里设计的囚徒困境也是单次的，审计机构甲和审计机构乙没有长期的合作关系，因此不大容易默契串谋起来谎报。如果两人有长期合作关系，那么两人合谋起来谎报也是有可能的。这也就是为什么现实中经常使用双头审计，而且每次履行同一审计任务的两个机构或个人并不相互熟悉的原因，因为委托人在聘请审计机构时也想到了相互熟悉的审计机构或个人之间合谋是更可能的。当然，对这个模型还可以有更多更专业的讨论，有兴趣的读者可参考Kofman和Lawarree(1996)的专业文章(“A Prisoner’s Dilemma Model of Collusion Deterrence,” Journal of Public Economics 1996, 59: 117-136)。我们这里的简单模型只是对他们文章一部分内容的简单改编。

四
　　第三个例子是有关政治中的策略性派系斗争的。众所周知，在政治中有各种派别，大到国家政治、小到组织政治，都是如此。为什么这些派别会产生？原因当然很多，最根本的是存在不同的利益集团。但是，有时候这种利益集团正是政治领袖创造出来的。无论在历史或现实中，每个政治领袖的上台，都是在一些势力的支持下而取得政治地位的。同样，如果存在较大的反对势力则领袖的政治地位也是不牢固的。所以，上台后的领袖常常会有意实施歧视性赏罚，使得潜在的反对势力被瓦解并陷入相互争斗的囚徒困境，互相消耗力量，从而领袖本人的政治地位就得到了巩固。
　　很多时候，人们很纳闷为什么独裁政权可常常可以长期存在。按理，如果人民反对独裁，那么他们应可联合起来推翻独裁政权。精明的独裁者当然也意识到这一点——早在一千四百多年前唐太宗就认识到“水可载舟，亦可覆舟”——于是，他们往往构造起类似于囚徒困境的社会制度，让人民内耗于其中，从而达到其统治的长治久安。比如，他可以创造一种奖励和竞争系统，如果别人反对独裁者而你追随独裁者则可以丰厚的奖励，如果别人追随独裁者服务而你必须支持才不致受到惩罚，这样使人们陷入争相取宠于独裁者的“囚徒困境”之中。于是对独裁者来说就天下太平了。2005年Clarck奖章得主Acemogolu等人在一篇讨论“分而治之”的文章中以类似的思想讨论了，一个“窃贼治理”(Kleptocratic)的国家中，人们的力量本足以推翻统治者但是统治者的权位却未受到任何挑战的原因。(D.Acemoglu et al. “Klepotocracy and Divide-and-Rule: A Model of Personal Rule”, JEEA Papers and Proceedings, 2004, Vol.2.pp162-192)。
　　上面几个例子说明，囚徒困境并非完全很糟糕。有时候设计得当，人们也可从策略性地运用囚徒困境机制中得到好处。开动你的聪明头脑，你一定还可以寻找更多的可运用囚徒困境获利的地方。

附录：囚徒困境
　　囚徒困境讲的是这样一个故事：两个人因盗窃被捕，警方向怀疑其有抢劫行为但未获得确凿证据可以判他们犯了抢劫罪，除非有一个人或两个人都供认。但即使两人不承认，也可判他们盗窃物品的轻罪。囚徒被分离审查，不允许他们之间互通消息，并交代政策如下：如果两人都供认，每个人都将因抢劫罪加盗窃罪判2年监禁；如果两人都拒供，则两人都将因盗窃罪判处半年监禁；如果一个人供认而另一个拒供，则供认者被认为有立功表现而免受处罚，拒供者将因抢劫罪、盗窃罪以及抗拒从严而被重判5年。这个故事的结局是：两个囚徒都会选择招供，尽管大家都不招供是更好的结局。因为每个囚徒的都是这样考量的：因为每个囚徒都会发现：(1)如果对方拒供，则自己供认便可立即获得释放，自己拒供会被判0.5年，因此供认是较好的选择；(2)如果对方供认，则自己供认将被判两年，自己拒供会被判5年，因此供认是较好的选择；(3)因此，无论对方拒供或供认，自己选择供认始终是更好。于是大家就都招供了。这个故事一直被当作描述个人理性与集体理性发生冲突的典型例子和分析模型。

Q筱燕 · 发表于 2010-4-14 18:44:44

唉~~~~~~~~~~~~~~~
这次我都不知道谁什么了！
灌水！

账号		自动登录	找回密码
密码			立即注册

[转载] 被设计的“囚徒困境”

注册后推荐绑定QQ，之后方才可以使用下方的“用QQ帐号登录”。

浏览过的版块