什么才是长期合作博弈的最佳策略

很多人都听说过“囚徒博弈”，博弈双方都朝着对自己最有利的方向进行理性决策，最终却无可奈何地得出“双输”的结果。

但现实并不是只博弈一次的一锤子买卖，参与博弈的对象往往也远多于两个。那么，在长期的、多次的、多人参加的博弈中，什么才是最佳策略呢？

1980年代，密歇根大学的社会学家/政治学家罗伯特·阿克塞尔罗德（Robert Axelord）组织了一个博弈竞赛，内容就是囚徒困境，所有参与者（不同策略）两两博弈，看最终谁的收益最大。

可以预想，参与者设计了各种各样复杂的博弈策略，但最终胜出的却是一个非常简单的策略，英文叫“Tit for Tat”，一般翻译作“以牙还牙”，更确切的含义可能是“针锋相对”。

这个策略其实就两条：

1、首先（第一轮）选择合作；

2、复制上一轮对手的选择。

上一轮对手选择合作，我就选择合作；上一轮对手背叛，我就选择背叛。

这不就是中国古话说的，“人不犯我，我不犯人；人若犯我，我必犯人”？

没想到这样一个简单的策略竟取得了最好成绩。阿克塞尔罗德也不太敢相信，又组织了第二次比赛，更多博弈论专家、计算机专家、心理学家参与进来，出现了更复杂的算法，结果胜出的还是这个“以牙还牙”。

那么“以牙还牙”策略有什么特点呢？

1、友善：“以牙还牙”首先选择合作，不主动背叛；

2、报复：遭到背叛，就一定还击；

3、宽恕：对方再次合作，就既往不咎；

4、不嫉妒：每一轮最好的结果只是和对方打平。

“以牙还牙”策略顾及的是大局，集体利益为上，长期利益为上。结果在复杂的多次多人重复博弈中，反而老实人获得了最终的胜利。

于是上述四个特点似乎也可以成为我们为人处世的参考。其中两条根本就是孔老夫子所说的“以直报怨，以德报德”嘛。

后来阿克塞尔罗德就写了本书，叫《合作的进化》，已经是名著了。我还没读过，但是看豆瓣评分挺高。

不过且慢，“以牙还牙”实际上是一个很脆弱的策略。在计算机模拟中，这个策略很有效，但在现实中则未必，因为现实容易出差错。

设想下，如果某一轮，对手不小心操作失误，或者像现实中经常会遇到的可能是“无心之过”，结果你选择了“以牙还牙”。那，既然大家都知道“以牙还牙”是个好策略，对方继续“以牙还牙”。结果呢，就是陷入无限的报复……

明明只是选择了“以直报怨”，却因为现实中的差错或误解，导致了“冤冤相报何时了”。

所以博弈论专家们发明了一个在现实中更“宽容”一些的策略，可以称作“以牙还牙（改进版）”或者“宽容以牙还牙”，英文是”Tit for tat with forgiveness” 。在这个策略里头，对方背叛一次，我继续合作；只有当对方连续背叛两次，我再报复。

假如人人都宽容一些，也许才更有利于全社会利益的最大化。

不过，直到前阵子，我才听说关于这个问题，最佳策略又易主了。

哈佛大学教授马丁·诺瓦克（Martin A. Nowak）在经过无数次计算机模拟后，发现了一个更优的策略，叫做“Win-stay, lose-shift”，意思是赢就继续输了就变，也有翻译作“赢定输移”。

诺瓦克也写了本书，叫《超级合作者》，我还没空看。

“赢定输移”策略比“以牙还牙”策略胜在哪里呢？

第一，它比“以牙还牙”更冷酷。遇到好骗的，它就骗；只要能骗，就一直骗下去。

第二，它对认知能力的要求更低。不需要观察对手什么策略，只要看自己的得失，赚了就继续，亏了就换招。

这个策略，击败了“以牙还牙”和“宽容以牙还牙”。而且，它竟然更简洁。我们不由得怀疑它是不是已经很接近最终“真理”了。

但是所有思想实验都是有边界条件的，它们都能给我们启发，但都不会是复杂世界的简单真理。

“赢定输移”这个策略其实也有瑕疵，就是它假定的是博弈双方同时出招。但是，各位，我们现实中的博弈，哪有什么同时出招，都是有先后的（不过很多场合可简化视作同时出招）。

科学家们通过大量的实验发现，在“同步型”的囚徒困境博弈中，“赢定输移”是最优策略；然而在“交替型”囚徒困境博弈中，“宽容以牙还牙”反而更胜一筹。大概，是因为“宽容以牙还牙”更鼓励合作，也更注重集体利益吧。

复杂的世界，既不会是纯粹的“同步型”，也不会是纯粹的“交替型”，甚至可能都不会是囚徒困境博弈。但话虽如此，这些有趣的思想实验对我们的决策模式还是有很大参考价值。

无论是“赢定输移”策略，或者“宽容以牙还牙”策略，它们都有很重要的一点，就是——重视反馈。归纳法诚然有遇到许多谬误，但从实践的结果中不断地去学习和调整，恐怕是我们不完美的人类所能做出的最佳选择。

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://yundeesoft.com/84866.html

什么才是长期合作博弈的最佳策略

相关推荐

发表回复