与AI一起“石头剪刀布”

2021-10-07 01:42风池
知识窗 2021年6期
关键词:胜率剪刀概率

风池

自从AI出現后,在很多竞技类游戏中,人类都败给了AI,最著名的就是1997年“深蓝”击败国际象棋大师卡斯帕罗夫事件。对于AI击败人类,有些人表示不服,认为AI之所以能击败人类,是它掌握了更多的信息,能根据算法预测出人类的“套路”,如果在随机游戏中,比如“石头剪刀布”这种没有规律的游戏,AI不一定赢得过人类。事实真的是这样吗?

在人们的一般认知里,“石头—剪刀—布”三种出法随机出现,相互克制。每次出手只会有三种结果,即输、赢和平局,每次玩家获胜的概率都是三分之一。这种游戏看起来很公平,而且充满随机性,所以在生活中,当遇到问题无法解决时,人们便非常乐于通过这种小游戏来做选择。但是,这种游戏真的是随机的吗?答案是否定的。

浙江大学何赛灵教授的研究团队开发了一个基于马尔可夫链的AI模型,专门用来玩“石头剪刀布”游戏。游戏的规则是:赢了加2分,平局加1分,输了不得分。为了确保人类玩家能尽可能地按照自己的想法出拳,杜绝乱选或者放水,游戏设置了金钱奖励,总分越高,得到的奖励越多。但是,在与52个人类玩家分别大战300回合之后,AI击败了95%的玩家。在最悬殊的一场较量中,AI获得了198次胜利,55次平手,仅输了47次。实验总计进行了15600次,最终结果表明,在这个游戏中,AI大概率击败了人类玩家。如果“石头剪刀布”游戏真的是随机的,面对如此大的样本,AI根本不可能占有优势。

这里面有什么玄机吗?确实有。从本质上来看,“石头剪刀布”属于博弈问题,其背后蕴藏着经典的纳什均衡,而每个个体的习惯、认知和策略都会影响实际胜率。比如你和对手很熟悉,那么你可能知道他(她)经常出布,因此可以多出剪刀来克制。科研团队提出的AI模型就是利用了类似的原理,证明了“石头剪刀布”真的存在针对不同个体的长期制胜策略,可以有效提高胜率。

这套AI模型基于n-阶马尔可夫链设计,拥有记忆性,能够向前追溯最多n个历史状态并加以利用。为了增加AI的胜率,研究团队还针对人类玩家的不同性格和策略发明了一套Multi-AI模型。这套模型含有多个锦囊,如果人类玩家连续胜利,就会促使Multi-AI转向选择其他AI模型的更优解。如果人类玩家连续失败,大概率会转换策略,或者打破之前的出拳规律,这时Multi-AI也可以随之调整。所以,人类玩家最终大概率还是会输。

由此可见,玩“石头剪刀布”,人类确实玩不过AI,因为AI足够聪明,它总能根据既往数据和当前对手的特点,找到人类玩家的漏洞,进而取胜。但是,你认为AI仅仅用于“石头剪刀布”吗?其实它的用处太多了,它可以是一个很厉害的循环制衡模型分析师,未来有望拓展到其他博弈场景,比如预测竞争对手的下一步举动、规划更有效的竞选策略,或者制订更有利的定价方案等。

猜你喜欢
胜率剪刀概率
概率与统计(1)
概率与统计(2)
主客场因素对大学生篮球联赛战绩的影响研究
概率与统计解答题集锦
2014—2015年中国女子篮球职业联赛单节得失分与比赛结果相关性分析
石头剪刀布
贫民富翁