如何利用零和混合策略博弈设一个必赢的赌局

又是美好的周一,正当超模君在为即将到来的假期做准备忙得焦头烂额时,突然有人敲开了办公室的门,接着,一箱特某苏就被送了进来。

如何利用零和混合策略博弈设一个必赢的赌局

你敢和我赌吗?

如何利用零和混合策略博弈设一个必赢的赌局

又是美好的周一,正当超模君在为即将到来的假期做准备忙得焦头烂额时,突然有人敲开了办公室的门,接着,一箱特某苏就被送了进来。

快递小哥:您好,请问超模君是哪位?这是您的快递,麻烦签收一下。

如何利用零和混合策略博弈设一个必赢的赌局

听到有快递,超模君先是有点懵,心想:最近也没买东西呀?怎么会有快递?

不过,尽管心存疑问,但拆快递这么激动人心的事情,怎么可以放过呢。

如何利用零和混合策略博弈设一个必赢的赌局

打开快递箱之后,并不是大家以为的特某苏,而是模友寄给超模君的长满毛的椰子

原来,在前两天超模君做“毛球定理小实验”时,找不到带毛的椰子,贴心的模友看到之后,便给超模君寄了过来。

如何利用零和混合策略博弈设一个必赢的赌局

由于这位模友没有留下自己的姓名和地址,超模君无法确定是哪位,麻烦看到文章之后,留言联系一下超模君,鹅准备送你一份小礼物啦。

模友送的明信片里面提到,现在湛江已经很热啦,而在广州的超模君也想说,这几天真的很热。

这不,上个周末出去玩,都快中暑了。。。

如何利用零和混合策略博弈设一个必赢的赌局

就在上周,超模君看着隔壁公司的都去春游了,便决定周末带着整个超模团队出去浪一天。

而到了晚上要休息的时候,找到了京西大旅馆。

不过,京西旅馆一间房一晚就要200块钱,超模君摸摸口袋,啊哈,今天出门太急,除了带了羊城通,什么都没带……

(小天、小木、小模君、小智内心都翻起了白眼)

正当超模君在旅馆门口尴尬徘徊时,作为超模团队颜值担当的小天决定跑去“色诱”老板刘强西:

“刘老板,我想到一个很好玩的游戏,可是没人跟我玩,请问强西老板可以跟我玩吗?”

如何利用零和混合策略博弈设一个必赢的赌局

小天这媚眼一抛,刘强西立刻醉了,说:“当然可以,游戏规则是怎样的呢?”

如何利用零和混合策略博弈设一个必赢的赌局

于是小天就说

“游戏很简单,我们各自亮出硬币的一面。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以啦。”

虽然已经激动万分,想要跟小天玩这个游戏,但是,一直以来都比较“精明”地经营着京西大旅馆的刘老板,还是小算了一下这个游戏赢的概率。

刘老板大脑开始运转了,想着:都是正面的概率是1/4,都是反面也是1/4,一正一反的概率是1/2。

那么通过这个游戏,我获得的奖励的期望是

E=1/4·3+1/4·1-1/2·2

如何利用零和混合策略博弈设一个必赢的赌局

这游戏很公平啊,没想到小天竟然想跟我玩这么无趣的游戏,难道真的是我太有魅力了?!(超模君:你真的想多了。。。)

然后,刘老板就很开心地跟小天玩起游戏来。

如何利用零和混合策略博弈设一个必赢的赌局

经过n轮的比拼,结果是刘老板输了3间房的租金。

而超模团队顺利免费入住了京西旅馆。

如何利用零和混合策略博弈设一个必赢的赌局

那天晚上12点,刘老板都还没睡着,总感觉今晚有点“诡异”。。。

如何利用零和混合策略博弈设一个必赢的赌局

回想起今晚跟小天玩游戏的前后:我跟小天玩的是亮硬币,而不是拋硬币,因此亮出硬币正反面的概率是可以控制的!

于是,刘老板赶紧拿起笔在草稿纸上算了起来。。。

经过认真的计算,刘老板终于发现:

如果我以 0≤x≤1 的概率出正面,而小天以3/8的概率出正面,那么我的期望收益为

E=3/8·x·3+5/8·(1-x)·1-[3/8·(1-x)+5/8·x]·2=-1/8

也就是说在这种情况下,无论我怎么选择亮硬币的概率,我平均每轮都要亏 1/8 块钱,这还得了!警察蜀黍,我遇到骗子啦!

超模君满意地点点头:小天真聪明!

如何利用零和混合策略博弈设一个必赢的赌局

(又帮我省了一笔)

——————————————————————————–

(以上故事纯属虚构,如有雷同,算我抄你。)

———————————————————————————

各位模友应该知道上面故事所说的3/8是怎么得来的吧?

其实这道题不是简单的概率问题,而是一个经典的零和混合策略博弈问题

假设刘强西出正面的概率是p₁,小天出正面的概率是p₂,那么刘强西的平均收益则为

E₁=3·p₁·p₂+1·(1-p₁)·(1-p₂)-2·(p₂·(1-p₁)+(1-p₂)·p₁)

小天的则是

E₂=-3·p₁·p₂-1·(1-p₁)·(1-p₂)+2·(p₂·(1-p₁)+(1-p₂)·p₁)

这个游戏只有一个混合策略纳什均衡(Nash equilibrium),即(p₁*,p₂*)=(3/8,3/8)

如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。

混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。

如何利用零和混合策略博弈设一个必赢的赌局

而小天就是

使用了达到纳什均衡的那个策略,即p₂=p₂*=3/8。

也就是说,无论刘强西选择什么策略都会有相同的收益期望,即刘老板平均每轮都要亏 1/8 块钱,玩得越多,亏得越多。

如何利用零和混合策略博弈设一个必赢的赌局

第二天早上,超模君看着刘老板还是一副心痛的样子,便上前安慰了一声:不要这样子闷闷不乐吧,钱不要紧,我们下次继续光顾你们家旅馆就是啦。

如何利用零和混合策略博弈设一个必赢的赌局

本文系网易新闻·网易号“各有态度”特色内容

部分资料来源于网络

转载请在公众号中,回复“转载”

—–这里是数学思维的聚集地——

“超级数学建模”(微信号supermodeling),每天学一点小知识,轻松了解各种思维,做个好玩的理性派。50万数学精英都在关注!

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/84894.html

(0)

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

关注微信