当前位置: 首页 > news >正文

博弈论03——混合纳什均衡的收益求法

纳什均衡第二部分

  • 性别之战——回顾
    • 存在纯纳什均衡
    • 存在混合纳什均衡
    • 总结
  • payoffs收益求法

性别之战——回顾

背景:
Alice 和 Bob 这两位玩家是朋友,他们想见面喝杯咖啡。Alice 喜欢去 Costa,Bob 更喜欢去星巴克,但最重要的是,对他们来说最重要的是去同一个地方,这样他们才能真正见面。

在这里插入图片描述

存在纯纳什均衡

Best response 法
在这里插入图片描述
得到两个纯纳什均衡。

存在混合纳什均衡

对于Alice:

EUBC=EUBSσAC(1)+(1−σAC)(0)=σAC(0)+(1−σAC)(3)σAC=3−3σAC4σAC=3σAC=34\begin{aligned} \text{EU}_{BC} &= \text{EU}_{BS} \\ \sigma_{AC}(1) + (1 - \sigma_{AC})(0) &= \sigma_{AC}(0) + (1 - \sigma_{AC})(3) \\ \sigma_{AC} &= 3 - 3\sigma_{AC} \\ 4\sigma_{AC}&=3 \\ \sigma_{AC} &= \frac{3}{4} \end{aligned} EUBCσAC(1)+(1σAC)(0)σAC4σACσAC=EUBS=σAC(0)+(1σAC)(3)=33σAC=3=43
Alice的混合策略是(3/4 ,1/4)

对于Bob:

EUAC=EUASσBC(3)+(1−σBC)(0)=σBC(0)+(1−σBC)(1)3σBC=1−σBC4σBC=1σBC=14\begin{aligned} \text{EU}_{AC} &= \text{EU}_{AS} \\ \sigma_{BC}(3) + (1 - \sigma_{BC})(0) &= \sigma_{BC}(0) + (1 - \sigma_{BC})(1) \\ 3\sigma_{BC} &= 1 - \sigma_{BC} \\ 4\sigma_{BC}&=1 \\ \sigma_{BC} &= \frac{1}{4} \end{aligned} EUACσBC(3)+(1σBC)(0)3σBC4σBCσBC=EUAS=σBC(0)+(1σBC)(1)=1σBC=1=41
Bob的混合策略是(1/4 ,3/4)

总结

混合策略的求法:设定自己的概率,让对方无差别,用对方的payoff×自己的概率,并相等。

一个博弈是否可以同时存在纯纳什均衡和混合纳什均衡
是的,可以同时存在。
许多博弈(如“性别之战”)既有纯策略纳什均衡,也有混合策略纳什均衡。

一个博弈是否一定存在至少一种纳什均衡?
是的,每个有限博弈(有限个玩家 + 有限个策略)根据纳什定理(Nash’s Theorem),至少存在一个纳什均衡(可能是纯的,也可能是混合的)

payoffs收益求法

计算方法:

  1. 求出每个玩家的混合纳什策略概率;
  2. 相乘,求出每个事件发生的概率
  3. 每个事件发生的概率乘以这个事件发生对这个玩家的payoff影响。相加求和。

性别之战

在这里插入图片描述
相乘,求事件概率

在这里插入图片描述

对于玩家1,
在这里插入图片描述
Payoff1=1∗2/9+0∗1/9+0∗4/9+2∗2/9=5/9Payoff_1 = 1 * 2/9 + 0 * 1/9 + 0 * 4/9 + 2 * 2/9 = 5/9Payoff1=12/9+01/9+04/9+22/9=5/9

对于玩家2,

在这里插入图片描述
Payoff2=2∗2/9+0∗1/9+0∗4/9+1∗2/9=2/3Payoff_2 = 2 * 2/9 + 0 * 1/9 + 0 * 4/9 + 1 * 2/9 = 2/3Payoff2=22/9+01/9+04/9+12/9=2/3

http://www.lryc.cn/news/603300.html

相关文章:

  • 【Linux入坑(一)—全志T133开发板适配欣瑞达LVDS 7寸(800*480)屏幕】
  • 函数对象 vs 函数指针 vs lambda:该用哪个才高效?
  • python学习DAY26打卡
  • Java高级技术知识点
  • GitLab的安装及使用
  • 路由器路由协议详解:从 RIP 到 OSPF 的技术演进
  • 理解Transformer解码器
  • 【术语扫盲】MCU与MPU
  • 《HCIA-Datacom 认证》希赛三色笔记:Vlan间三层通信过程解析
  • 高级08-Java JVM调优:优化你的Java应用
  • 面向对象系统的单元测试层次
  • 医疗AI新基建:MCP与A2A协议的破局与前瞻
  • MySQL——MVCC
  • Django自带的加密算法
  • 汇总10个高质量免费AI生成论文网站,支持GPT4.0和DeepSeek-R1
  • 云端文档管理新纪元:Paperless-ngx与cpolar打造的无边界文件生态
  • PHP性能优化与高并发处理:从基础到高级实践
  • 深入理解Java Map的entrySet()方法
  • VLA--Gemini Robotics On-Device: 将AI带到本地机器人设备上
  • 在WSL中配置VS Code C++开发环境完整教程
  • LeetCode 1616.分割两个字符串得到回文串
  • 【21】C# 窗体应用WinForm ——图片框PictureBox属性、方法、实例应用
  • 【MySQL学习|黑马笔记|Day2】SQL|DML、DGL、DCL,函数,约束
  • redis得到shell的几种方法
  • 搭建专属AI聊天网站:NextChat + 蓝耘MaaS平台完整部署指南
  • 《C++初阶之STL》【list容器:详解 + 实现】
  • 夯实家庭基石本质上是一场“缓慢的革命”
  • 【Redis实现基础的分布式锁及Lua脚本说明】
  • 使用 Canvas 替代 <video> 标签加载并渲染视频
  • 【深度学习】独热编码(One-Hot Encoding)