900字范文,内容丰富有趣,生活中的好帮手!
900字范文 > 无限循环的重复囚徒困境 你能应付吗?

无限循环的重复囚徒困境 你能应付吗?

时间:2023-10-18 19:19:11

相关推荐

无限循环的重复囚徒困境 你能应付吗?

简单的儿童游戏「哪只手里有硬币?」具有不简单的递归逻辑。藏硬币的人进入这样一个无止境的过程:「我刚才把硬币藏在右手里,那么现在猜的人会认为它在我的左手,因此,我要把它移到右手。但她也知道我知道她会怎么想,于是,我还是把它留在左手里。」

由于猜的人的思考过程也是如此,双方就构成了一个相互预测对方意图的游戏。从这类简单的规则衍生出的无限复杂性令约翰·冯·诺依曼非常感兴趣。冯·诺依曼将游戏定义为一场利益冲突,游戏各方都试图预测其他方的举动,并采取一系列的步骤,以解决冲突。1944年,他与经济学家奥斯卡·摩根斯特恩合写了一本书——《博弈论与经济行为》。他察觉到,经济具有高度共同进化和类似游戏的特性,而他希望以简单的游戏动力学来阐释它。

举例说,鸡蛋的价格取决于卖方和买方彼此之间的预期猜测——我出价多少他才能够接受,他认为我会出多少,我的出价应该比我能承受的价位低多少?令冯·诺依曼惊讶的是,这种相互欺诈、相互蒙骗、效仿、映像以及「博弈」的无休止递归一般都能够落实到一个明确的价格上,而不是无限纠缠下去。即使在股市上,当有成千上万的代理在玩着相互预测的游戏时,利益冲突的各方也能迅速达成一个还算稳定的价格。

这就引出了博弈论中的「囚徒困境」:游戏中,两个分别关押的囚犯必须独立决定否认还是坦白罪行。如果两人都认罪,两人都会受到惩罚。如果两人都否认,则都会被无罪释放。但假如只有一人认罪,那么他就会得到奖励,而另一个则受到惩罚。合作有回报,背叛也有回报。你该怎么办呢?如果只玩一次,背叛对手是最合理的选择。

但如果是「重复的囚徒困境」呢?游戏的推演就发生了变化。你不能无视对手玩家的存在;不论是作为强制的敌手还是同伙,他都必须受到重视。这种紧密相连的共同命运与政敌之间、生意对手之间或者生态共生体之间的共同进化关系非常类似。随着对这个简单游戏的研究的进一步深入,问题变成了:要想在长期内取得高分,面对「重复的囚徒困境」应该采取什么样的策略?还有,同无情或友善的各类玩家对垒时,该采取什么样的策略更容易取得成功呢?

1980年,密歇根大学征集了14条不同的用于「囚徒困境」的对策,以循环赛的形式看哪个对策最后胜出。最后获胜的是一个最简单的对策,叫做「一报还一报」,由心理学家阿纳托尔·拉普伯特设计。「一报还一报」是往复型策略,它以合作回报合作,以背叛回报背叛,往往产生一轮轮合作的周期。重复游戏能产生一次性游戏所不具备的「未来阴影」之效果,这种效果鼓励合作,因为对玩家来说,用现在对他人予以的合作来换取今后他人给予的合作是一个合理的选择。

在后工业化经济里,自发合作是常有的事情。被广泛采用的工业标准(既有质量方面的,也有协议方面的,如110伏电压,还有ASCII码),以及因特网------世界上最大的无政府形态的兴起,都使得人们更加关注孕育共同进化合作所需的必要条件。这种合作不是新时代的精神至上主义。恰恰相反,这是一种「不讲交情、无需远见的合作」——是大自然的冷规则,适用于许多层面,并催生了自组织结构。不管你愿不愿意,多少都得合作。

「重复囚徒困境」这类游戏,不单只人类,任何自适应个体都可以玩。细菌,犰狳,或是计算机里的半导体器件,都可以根据各种回报机制,在眼前的稳妥收获与未来的高风险高回报之间做出权衡。当长时间与相同的伙伴一起玩这个游戏时,双方既是在博弈,又是在进行某种类型的共同进化。每一个复杂的自适应组织都面临着基本的权衡。

生物必须在完善现有技能、特质(练腿力以便跑得更快)与尝试新特质(翅膀)之间作取舍。它不可能同时做所有的事情。这种每天都会碰到的难题便属于在开发和利用之间作权衡。只有当猎物能存活时,这些策略才能兴旺发达。这就导出了自然界荒野中俯拾皆是的生物数量呈周期性波动的机理。兔子数量增,狐狸繁殖多;狐狸繁殖多,兔子死翘翘。但是没有了兔子,狐狸就得饿死。狐狸数量少了,兔子数量就多了。兔子多了,狐狸也就多了,以循此往复。

零和与非零和游戏的区别是少数几个渗透到大众文化中的博弈论理念之一。象棋、选举、赛跑和扑克是零和游戏:赢家的收益取自输家的损失。自然界的荒野、经济、思维意识、网络则属于非零和游戏:熊的存在并不意味狼獾会失败。共同进化中的冲突环环相扣、彼此关联,意味着整体收益可以惠及(有时殃及)所有成员。

来自博弈论最早也是最重要的洞见之一就是,非零和游戏的战略内涵与零和游戏的战略内涵截然不同。零和游戏中对他人的任何伤害都对你有好处。在非零和游戏中,你们可能共荣,也可能同衰。

这个理念初看不可思议。下棋怎能不击败对手就获胜呢?但是在共同进化中——变化是响应自身而变化——不用打击他人就能赢。企业界那些精明的首席执行官们现在也承认,在网络和结盟的时代,公司犯不着打击他人就可以大把地赚钱。这个就是所谓的多赢。多赢是共同进化模式下生命所演绎的故事。

戈尔巴乔夫具有基本的共同进化洞察力,他看到,减少而不是增加坦克数量会让苏联更安全。他单方面裁掉了一万辆坦克,使得美国和欧洲更难有借口保持大规模的军事预算,借此全面展开了结束冷战的进程。

对于有些人来说,从共同进化中获得的最有用的教训就是,在共同进化的世界里,控制和保密只能帮倒忙。你无法控制,而开诚布公比遮遮掩掩效果更好。在零和游戏中隐藏自己的策略是本能,但在非零和游戏中,你可能会将策略公之于众,这样一来,别的玩家就必须适应它。戈尔巴乔夫的策略之所以有效,是因为他公开实施了这个策略;如果只是秘密地单方面削减武器则会一事无成。

从苏联指令式计划经济的崩溃中我们了解到,公开的信息能够保持经济的稳定和增长。共同进化可以看作是双方陷入相互传教的网络。共同进化的关系,从寄生到结盟,从本质上来讲都具有信息的属性。稳步的信息交流将它们焊接成一个单一的系统。与此同时,信息交流——无论是侮辱、还是帮助,抑或只是普通新闻——都为合作、自组织,以及双赢结局的破土发芽开辟了园地。在这个时代,开放者赢,中央控制者输,而稳定,则是由持续的细小误差所维持的一种永久的濒临失控的状态。这个结论,无疑给了我们应对无限循环的「重复的囚徒困境」一些宝贵的启示。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。