按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
,并接受该公司提供的折扣。只有在一家公司提供折扣券而其他公司不提供的时候,消费者才会被提供折扣券的公司吸引过去,尝试这个新牌子。
诸如可口可乐与百事可乐这样的竞争对手之间的折扣券策略博弈,其实就跟吉姆和德拉的合作问题极为类似。两家公司都想成为提供折扣券的公司。但是,假如他们同时这么做,折扣券就不能发挥原来设想的作用,两家的结局甚至会比原来更糟。一个解决方案是遵守一种可预测的模式,每隔半年提供一次折扣券,几个竞争者轮流提供折扣券。这个方案的问题在于,当可口可乐预计到百事可乐快要提供折扣券的时候,它就应该抢先一步提供折扣券。要避免他人抢占先机,惟一途径就是保持“出人意料”的元素,而这一元素来自一个随机化的策略。①①
一些有力的统计证据表明,可口可乐和百事可乐达成了某种发放折扣券的合作方案。据《60分钟时事》(“60M
Minutes”)报道,曾经有一段长达52个星期的时间,可口可乐和百事可乐分别发放了26期折扣券,其间没有出现两家同时发放折扣券的现象。若是没有事先约定,两家独立行事,那么,它们各自发放26期折扣券而不会出现同时发放现象的概率是1/495918532948104——即1000
亿次也不会出现1次。
在商界还有其他例子可以说明我们必须避免陷人一个固定模式,防止对手轻易预测我们的行动。一些航空公司向愿意在最后一分钟买票的乘客提供优惠机票。不过,这些公司不会告诉你究竟还剩下多少座位,而这个数字本来有助于你估计成功得到机票的机会有多大。假如最后一分钟所剩机票的数量变得更容易预测,那么乘客利用这一点占便宜的可能性就会大得多,航空公司也会因此失去更多本来愿意购买全价机票的乘客。
在商界,随机策略的最广泛用途在于以较低的监管成本促使人们遵守规则。这已经应用于从税收审计、毒品测试到付费停车计价器的许多领域,同时解释了惩罚不一定要和罪行吻合的原因。
由付费停车计价器记录的违章停车的典型罚金是正常收费标准的许多倍。设想一下,假如正常收费标准是每小时1美元,按照每小时1。
01美元的标准进行处罚能不能让大家从此变得服服帖帖呢?有可能,条件是交通警察一定可以在你每次停车而又没向计价器投钱的时候逮住你。这样一种严格的监管方式可能变得代价高昂。交通警察的薪水将成为首要议题;此外,为了保证警方说到做到,必须经常检测收费机,这笔费用可能也是巨大的。
监管当局有一个同样管用、代价又小的策略,就是提高罚金数目,同时放松监管力度。比如,罚金若是高达每小时25美元,这时候,哪怕25次违章只有1次会被逮住,已经足够让你乖乖付费停车了。一支更小型的警察队伍就能胜任这项工作,而收取的罚金也更接近弥补检测成本的水平。
这是又一个证明随机策略的用处的例子。在某些方面,这个例子与网球比赛的例子类似,但在其他方面存在区别。我们再次看到,当局选择一种随机策略的原因在于这么做胜过任何有规则的行动:完全不监管意味着浪费稀缺的停车空间,而100%的监管的代价又高得难以承受。不过,处于另一方的停车者不一定也有一个随机策略。实际上,当局希望通过提高侦察的概率和罚金数目,规劝大家遵守停车规则。
随机毒品测试与监管付费停车有许多相同点。若让每位职员每天都接受毒品测试,从而确定是不是有人用了毒品,这种做法不仅浪费时间,费用高昂,而且也没有必要。随机测试不仅可以查出瘾君子,还能阻止其他人由于觉得好玩而以身试“毒”。这么做和监管付费停车的例子一样,虽然查出瘾君子的可能性不大,但罚金很高。国税局的审查策略的一个问题在于,与被逮住的机会相比,罚金数目其实很小。假如监管属于随机性质,我们必须定出一个超过罪行本身的惩罚。规则在于,预期的惩罚应该与罪行相称,而这种心理预期应该将被逮住的概率考虑在内。
那些希望击败监管当局的人,也可以利用随机策略为自己谋利。他们可以将真正的罪行隐藏在许许多多虚假警报或罪行里,从而使监管者的注意力和资源大大分散,以至于不能有效发挥作用。举个例子:防空体系必须保证摧毁几乎百分之百的人侵导弹。对进攻方而言,击败防空体系的一个办法是用假导弹掩护真导弹。一枚假导弹的成本远远低于一枚真导弹。除非防守方真的可以百分之百地识别真导弹和假导弹,否则防守方就不得不开动防空体系摧毁所有入侵导弹,不管它们是真是假。
发射哑弹的做法起源于第二次世界大战,那时人们其实不是有意设计假导弹,而是为了解决质量控制问题。正如约翰·麦克唐纳在他的著作《扑克、商业与战争中的策略》(Strategy
in Poker,Business and
war)中所说,“销毁生产过程中出现的次品炮弹的成本很高。有人想到一个主意,说生产出来的哑弹可以随机发射出去。对方的军队指挥官担不起任凭一枚延时起爆炮弹落在自己阵地的风险,而他也辨别不了哪些是不会爆炸的哑弹,哪些是真会爆炸的延时起爆炮弹。面对真真假假的炮弹,他不敢大意,只好竭尽全力摧毁发射过来的每一枚炮弹。”·本来,防守方的成本与可能被击落的导弹相比只是九牛一毛,但攻击方也有办法使防守成本高到难以承受的地步。实际上,这个问题正是卷入“星球大战”的各方所面对的挑战之一;他们可能找不到任何解决方案。
11 .案例分析之七:霸王行动
1944年,盟军正筹划一次解放欧洲的行动,而纳粹决心抵挡这一进攻。首次登陆有两个可能的地点:诺曼底海滩和加来港。若守军不堪一击,登陆必然取得成功。因此,德国人一定要将重兵布在其中一个地点。进攻加来的难度很大,却也更具战略价值。因为加来更接近盟军在法国、比利时乃至德国本土的终极目标。
假设成功的概率如图7…10所示。
得失结果用0~100分表示。盟军成功登陆加来得100分,成功登陆诺曼底得80分,无论在哪个地方失手,都得O分(德国人的得失结果正好与此相反)。
假设你同时扮演盟军最高统帅艾森豪威尔(Eisenhower)将军以及德国在法国的海岸防卫指挥官、陆军元帅隆美尔(Rommel)
,那么,你会选择什么策略?
图7…10 盟军成功的概率案例讨论首先,将成功概率的信息和成功的分值综合起来,画出一个平均得分图(如图7…11
所示)。图中列出的分值是从盟军的角度得出的分值;德国人的得分可以看做这些数字的负数;因为双方的利益严格相悖。
图7…11
盟军得分图基本的策略当中并不存在一个均衡,我们必须转向混合策略。用威廉斯的方法,盟军选择诺曼底或者加来登陆的机会应为(100…20):(
80…60),即4:1,而德国人在诺曼底或者加来布防的机会应为(80…20):(100…60) ,即3:2
。盟军若是采取自己的最佳混合策略,平均得分为68。我们选用的概率和分值可能存在部分合理的成分,也可能似是而非,但在分析这些问题的时候不大可能做到完全精确或教条主义。现在就让我们把上述结果同实际情况做个比较。回首当年,我们知道,盟军的混合策略高度倾向于诺曼底,而这正是他们的实际选择。而在德国人这边,策略倾向也差不多。因此,以下情况也就不会那么出人意料了:德国决策层被盟军的双重间谍诡计、不同级别指挥官的意见分歧以及一些纯粹的坏运气(比如命运攸关之际主帅隆美尔偏偏不在前线)搞得晕头转向。结果,他们终于没能在D日(大规模进攻开始日,D…Day)下午盟军进攻诺曼底并且眼看得手的时候,将全部后备部队投入诺曼底前线,却仍然相信一场更大规模的偷袭已经瞄准加来。即便如此,争夺奥马哈滩的决战还是一度陷入拉锯状态。不过,盟军终于夺取了奥马哈滩,巩固了他们突入诺曼底的阵地。接下来的故事也就不用我们重复了。
第2部分结语
1 .历史注记
博弈论是由普林斯顿伟大的学者约翰·冯·诺伊曼首先提出的。早年,研究重点放在纯粹冲突的博弈(零和博弈)上。