友情提示：如果本网页打开太慢或显示不完整，请尝试鼠标右键“刷新”本网页！阅读过程发现任何错误请告诉我们，谢谢！！报告错误

无知的博弈:有限信息下的生存智慧-第5章

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

　　不妨用简单的数字运算来回答这个问题。设人口总数为10　000人，其中100人（1％）有缺陷，而9　900人没有。全部人口都做了该项检查，结果是100个有缺陷的人中被报告为确实有缺陷的人数为99人；而9　900个无缺陷的人中也有99人被（错误地）报告为有缺陷。即检查报告为有缺陷的人数是198人，而这当中实际上只有一半（99）的人是真的有缺陷，另外一半实际上是没有缺陷的。所以，有缺陷报告只意味着被报告人有50％的概率存在遗传缺陷。
　　上述推理过程，是根据结果来推断概率，因此也被称为逆概率推断。逆概率推断主要用到贝叶斯公式（见页下注或本书附录）。贝叶斯公式和逆概率推断思想在有限信息博弈分析中占有非常重要的地位。因为非对称信息博弈中，人们常常会通过观察对手的言行来判断对手的类型，或者说对手的言行往往传递着对手类型的信息，每当观察到对手的言行之后，博弈参与人就可以并且应当就这些观察到的言行对对手的类型进行重新推断以更新其信念，这种信念更新的逻辑过程正是按照贝叶斯公式来的。在第3章“察觉蛛丝马迹”一节，大家可以看到从对手言行推断对手类型信息在博弈中的重要性。
　　【更新慢或者章节错误，点击举报（请详细说明）】

＇12＇与上帝博弈（1）

　　单人决策问题，一般不认为是博弈问题。但是，博弈论对于考察单人面临的不确定决策问题也是适用的。我们可引入一个虚拟的参与人—上帝，他的策略空间就是随机试验的各种状态；然后假设参与人是跟上帝进行博弈。上帝对任何结果的偏好都是一样的，所以他事先随便选择了他的策略，但你并没有观察到上帝的选择。而你，则需要考虑如何才能更好地对付上帝，使自己的（预期）赢利达到最大。正所谓与天斗，其乐无穷。现在我们来看几个与上帝博弈的例子。
　　该不该改变最初的选择
　　下面要讲到的例子与美国20世纪70年代的一个电视节目有关，其中的概率计算曾困扰着成千上万的大众。在节目中，节目参与者将在三扇门之间选择其中一扇。这三扇门中有且仅有一扇门的后面放着奖品，另外两扇门则放着讽刺性礼品比如鸡崽（chicken）或者笨驴（donkey）。当节目参与者选定一扇门之后，主持人就会打开另外两扇门中没有奖品的一扇。然后在剩下的两扇关闭的门中，主持人会问参与者要不要改变最初的选择。
　　这里的问题就是：参与人希望获得奖品，而不是获得讽刺性礼品，那么现在仍关闭的两扇门中，他应当坚持最初的选择呢？还是改变主意选择另外一扇门？
　　大多数人凭直觉认为，剩下的两扇门中，每扇门后有奖品或没有奖品的概率各占50％。因此，改变主意选择另外一扇门和坚持最初的选择不改变，预期的赢利是一样的。的确，这种思路看来是没有什么错。因为在做最初的选择时，选择“碰巧是”正确的概率为1/3；而一旦选择之后，剩下两扇门，参与者从主持人的行为中所能得到的信息就只是将信念修正为自己选择正确的概率为1/2，选择失误的概率也是1/2。此外没有任何其他的信息改善。因此，他坚持原来的选择似乎可以说得过去。
　　但是，上述看法并不符合真实的情况。真实的情况是，若参与者改变自己最初的选择，那么获得奖品的概率是2/3，若不改变最初的选择，则获得奖品的概率仅为1/3。他应该改变自己最初的选择。
　　奇怪的是，将这个结果告诉参与者后，他们还常常难以理解为什么会这样。一种比较浅显的解释是这样的：在最初的选择中，选择了错误门的概率是2/3。如果参与人一开始的确选择了错误的门，那么主持人随后必然打开空门，而没有被打开的那一扇就必然有奖品，此时参与人显然应该改变主意转换到自己没选择也没有被打开的那扇门。如果最初的选择中参与人的确选正确了（概率为1/3），那么他显然应该坚持，并因此获得奖品。也就是说，如果参与人一开始就选错了，则参与人应该换门并一定获得奖金，如果参与人一开始就选对了，则应该坚持并一定获得奖金—于是，转换门获得奖金的概率与不转换门获得奖金的概率实际上就是最初选择是正确和错误的概率。而一开始，选择错误的概率是2/3，正确的概率是1/3。因此，在不知自己选择是正是误的情况下，在第二阶段改变主意转换到另一扇门，的确增加了获得奖品的概率。
　　对于有些喜欢做实验的读者，如果你不明白上述道理，那么我建议你做这样一个游戏：准备三张扑克和一枚硬币，让你的朋友来当节目主持人将三张牌铺在桌面上（并将那枚硬币放在其中一张之下）；然后你来选择一张牌；你的朋友从你没选取的牌中拿走没有硬币的一张，再问你是否改变你当初选的牌。为了证明转换选择比不转换选择更有可能获得奖品，你可以尝试以“转换选择”为策略进行数十次（比如50次）实验，再以“不转换选择”为策略进行同样多次数（比如50次）的实验。结果你会发现什么？你将发现“转换选择”的策略中得到硬币的次数基本上是“不转换选择”策略中得到硬币的次数的两倍，而这两种策略中硬币出现的频率也基本上分别接近2/3和1/3。
　　【更新慢或者章节错误，点击举报（请详细说明）】

＇13＇与上帝博弈（2）

　　当然，在一次性节目中，并不允许这样的重复实验。而且大多数人的确也不明智地选择了“不转换选择”。我曾在学生中做过这个实验，结果32人中有20人坚持“不转换选择”。这说明大多数人不清楚这样复杂的概率思考。更有意思的是，我跟我太太玩这个游戏时，她也是坚持“不转换选择”。当我告诉她如果转换可以成倍提高获奖概率时，她却说：如果我开始选对了，转换后结果错了就会后悔，所以心理素质好的就不应该转换。当然，她说的已经不是纯粹的概率计算，但也不是没有道理的。人们的行为的确不仅受制于各种精心的算计，也往往受制于某些心理因素（比如后悔）。不过，我对她的答案疑问在于：“如果开始选择对了，那么后来转换了选择会令人后悔。但是，如果后来你知道开始的选择错了，而你又没有转换选择，你就不后悔没有转换吗？”太太的回答更经典：“一开始选择错了，我只认为是运气不好，没什么可后悔的；如果开始对了，后来转换错了，才是后悔的。”这让我立即想到人们日常生活中常提到的道理：从没得到的东西，也就不会有失去它的痛苦，而已经得到的失去了，就会深感创伤。从太太的回答中，我突然明白了为什么行为博弈理论（behavioral　game　theory）现在大行其道。
　　乘车的最佳策略
　　一名游客要去某风景区游玩。每天开往风景区的只有三辆交通车，两趟车前后的间隔时间为5分钟。三辆车票价相同，但舒适程度则有高、中、低之分。这个游客不知道哪辆车最舒适，也不知道汽车开过来的顺序。不过对于他来说，多等5分钟或10分钟时间并无所谓，关键是要坐上最舒适的那辆车。
　　那么这名游客采取什么样的候车策略，才最可能搭上最舒服的那辆车呢？
　　这个问题，当然是一个单人决策问题，是不确定环境下的决策问题。这里的不确定性，源于游客对于不同舒适程度的三辆车开过来的顺序并不清楚。但列举起来，行车顺序无非有如下六种状态：上中下、上下中、中上下、中下上、下中上、下上中。那么我们可以虚拟一个参与人，即上帝，他选择的策略空间就是这六种状态。而且上帝这个参与人比较奇怪的一点就是，选择任何状态对他的赢利都是一样的，所以他在这六个策略之间以相同的频率随机地选择。
　　游客的目的是希望尽可能搭乘最舒适的车。他可以考虑的最简单的候车策略是：任意选择一辆车搭乘。他这样“随便”的选择，使他搭乘到最舒适的车的概率为1/3，这个结果一般的读者都能明白。
　　当然，游客也可以设计复杂一点的策略：第一辆车不上，如果第二辆比第一辆好就上第二辆，如果第二辆比第一辆差就上第三辆。这样的策略会使其搭上最舒适的车的可能性是多少？不妨把上帝可以选择的六种状态全列举出来，然后看看在哪些状态下，游客的这个策略刚好使他能够搭上最舒适的车（见图2…1）：
　　

返回目录上一页下一页回到顶部赞（0）踩（0）

未阅读完？加入书签已便下次继续阅读！

温馨提示：温看小说的同时发表评论，说出自己的看法和其它小伙伴们分享也不错哦！发表书评还可以获得积分和经验奖励，认真写原创书评被采纳为精评可以获得大量金币、积分和经验奖励哦！