46个回答

猜拳时对方说「我出剪刀」,那你出什么?

Young
4个点赞 👍

我还想回答准备个骰子,1·2出石头,3·4出剪刀,5·6出布。

没考虑到我国生产力的发展早给你准备好了,答主 @Air Mass 的图:

这个东西是用来帮你实现1/3出石头、1/3出剪刀,1/3出布的。毕竟人总是容易受影响,实现不了足够均匀随机的随机数。

为什么要这么做呢,这就要扩充下Air Mass的回答

首先我们知道,如果在石头剪刀布游戏中采取纯策略,比如必定出剪刀,是非常容易被针对的。

(你↓,对方→)石头剪刀
石头(0,0)(1,-1)(-1,1)
剪刀(-1,1)(0,0)(1,-1)
(1,-1)(-1,1)(0,0)

显然,如果只允许采用纯策略,那么石头剪刀布游戏中不存在纳什均衡。即题目中最直观的情况:如果对方出剪刀,你应该出石头;如果你出石头,应该能预见对方出布;如果对方出布,你应该出剪刀;如果你出剪刀,应当预见对方出石头;如果对方出石头,你应当出布;如果你出布,应当预见对方出剪刀……

于是这个问题变成了在无限的分母上求对方出剪刀石头布的概率的问题。假如你对对方在“第几层”的概率有所熟悉,你一定能得到一组(x,y,z)作为对方x%出石头、y%出剪刀,z%出布的结果。

这是一个概率分布上的混合策略,显然最佳方案是x的概率出布、y的概率出石头,z的概率出剪刀。然而你要是对对方熟悉到这种程度,一般对方也能反推出你会这么做,于是会故意改变自己的策略,变成x的概率出剪刀、y的概率出布,z的概率出石头。而你根据对方会在“第几层”的概率,又一次调整你的策略概率比……

显然,这样讨论下去是无穷无尽的,但是好在这种层层算计之下,这个解居然是收敛的。

当然,要按这种方式无论是算出来收敛的结果还是得出会收敛的结论实际上都复杂无比。但是经过你多年小镇做题家的经验你知道由于石头、剪刀、布的对称性,答案大概率是x=y=z,也就是各1/3。虽然现场算这个结果很麻烦,但是验证这个结果是不是纳什均衡却很容易。(如果收敛的结果不是纳什均衡,那么你们俩应该继续博弈下去,也就不是收敛的结果了)

显然同样由于对称性,如果这个解是纳什均衡,那么你和对方都会采取这个策略。这时假设对方的策略发生改变,变成了(x+Δx)的概率出石头,(y+Δy)的概率出剪刀,(z+Δz)的概率出布,那么你可以求得你获胜的概率为: x·(y+\Delta y)+y·(z+\Delta z)+z·(x+\Delta x) ,另外已知 x=y=z ,所以你获胜的概率可以简化为 x·(3x+\Delta x+\Delta y+\Delta z) 。另外 x+y+z=1 ,且 \Delta x+\Delta y+\Delta z=0 也就是这个式子的实际值是1/3。同样的式子可以得到你此时输的概率也还是1/3。综合即对方改变策略后的胜负情况与对方不改变策略时相等。那么这个策略就满足纳什均衡的定义,即每个参与人都无法单方面改变自己的策略以获得更好的收益。

当你的策略是纳什均衡时,由上可知对方无论做什么都无法提高自己的胜率,你的胜率也是堂堂正正的50%.


但是如果对方没意识到你是经历了如上的思考,那么可能会发生比较尴尬的行为,比如你出了布而对方真出了剪刀。这种尴尬容易影响你对掷骰结果的坚定程度。另外无论主观上还是客观上,你空手都没法完成随机1/3这种混合策略。所以你应当明晃晃地掏出骰子,拿个骰盒或者碟子+纸杯的简易骰盒,向对方明示你能够完成随机的混合策略并要这么施行。于是此时对方就算不老老实实的和你猜拳,也相当于和你老老实实的猜拳了。这就是所谓阳谋。

当然,对于石头剪刀布而言,当你采取这种策略时,对方无论做什么操作,都无法降低你胜率的同时,也无法抬高你的胜率。甚至对方先出,你也还是胜负平三种情况均分。


这个问题还有一些变种。

比如:你和对方猜拳,赢的得2元;同时对方承诺出剪刀,出其他的白给你100元。显然,这种情况下你可以通过必定出石头获得极高的收益,此时对方就算一直出布,每次也会给你98元。这个例子比较极端,我们不妨讨论下更模糊的情况下,应该如何操作。

问:你和对方猜拳,赢的从对手那里得2元;同时对方承诺出剪刀,出其他的无论输赢另外给你1元。此时你应该怎么做?

显然,这个博弈存在纳什均衡(有限标准形式博弈都有一个纳什均衡)。重新列一下收益表:

(你↓,对方→)石头剪刀
石头(1,-1)(2,-2)(-1,1)
剪刀(-1,1)(0,0)(3,-3)
(3,-3)(-2,2)(1,-1)

简单可以看出这个博弈没有纯策略纳什均衡。

设你选择(石头,剪刀,布)的策略分布为 s_你=(m,n,k) ,而对手的选择(石头,剪刀,布)的策略分布为 s_{对方}=(x,y,z)

记你选择石头、对方选择剪刀的情况记为“石剪”,出现该情况的比例记为 P(石剪) ,该情况下你的收益为 u_{石剪}=2 ,其余情况类推。

该策略下你的收益即 U_你(s_你,s_{对方})=P(石石)u_{石石}+P(石剪)u_{石剪}+P(石布)u_{石布}+P(剪石)u_{剪石}+P(剪剪)u_{剪剪}+P(剪布)u_{剪布}+P(布石)u_{布石}+P(布剪)u_{布剪}+P(布布)u_{布布}

由于上述全部收益情况已知,代入数值有:

U_你(s_你,s_{对方})=mx+2my-mz-nx+3nz+3kx-2ky+kz

若采取策略 s_你^* 时你的预期收益相对于任意策略 s_你 ,都有 U_你(s_你^*,s_{对方}^*)\geq U_你(s_你,s_{对方}^*) ,且同样对对方成立 U_你(s_你^*,s_{对方}^*)\geq U_你(s_你^*,s_{对方}) ,根据纳什均衡的定义可知混合策略列表 s^*=(s_你^*,s_{对方}^*) 是该问题的一个纳什均衡。(换句话说,就是此时谁改变策略都拿不到更多收益)

根据纳什均衡可推知, U_你(s_你^*,石头)=U_你(s_你^*,剪刀)=U_你(s_你^*,布) 。即

m-n+3k=2m-2k

2m-2k=-m+3n+k

m+n+k=1

s_你^*=(\frac{1}{2},\frac{1}{3},\frac{1}{6}) ,同理得 s_{对手}^*=(\frac{1}{3},\frac{1}{6},\frac{1}{2})

于是 U_你(s_你^*,s_{对方}^*)=\frac{2}{3}

即对于本文提出的这个变种问题,你拿个骰子,1·2·3对应出石头,4·5对应出剪刀,6对应出布,平均玩三次你赚2元。此时无论对方如何调整策略,你的收益都不变。在有明确的额外收益/损益的情况下,是确实可以适当调整策略的。

在这个变种问题中,乙是额外赌了1元,所以有此变化。当实际问题涉及一些其他因素时(比如对方公开赌自己的名誉,比如对方愿意说谎的话学狗叫之类的)可以将对应的收益按双方对此的理解判断具体收益情况,相对应的策略会发生改变。

雜音
自由评论 (0)
分享
Copyright © 2022 GreatFire.org