请问, 教授放过学生的概率. 张三选择平时勤快的概率. 博弈论. 谢谢

2025-03-09 23:22:36
推荐回答(3个)
回答1:

刚好做到这道练习题,试着来答一下。
感谢浙大蒋文华老师的mooc《博弈论基础》。

这是一道监督情境的博弈题。
为了使对方不具备占优策略,也使自己所得收益最大,应使对方无论采取任何策略,所得收益都一样。
假设张三平时勤快的概率为p,则平时偷懒概率为1-p。教授放过的概率为q,不放过的概率为1-q。
教授放过时的收益为3p-1*(1-p),不放过时的收益为-p
张三勤快时的收益为2q+1-q,偷懒时收益为3q
为了让张三勤快和偷懒时的收益一样,教授需要决定q=50%。
为了让教授放过和不放过时的收益一样时,学生需要决定p=20%。
因而教授采取放过的策略为50%,学生勤奋的概率为20%,此时可达到纳什均衡。

回答2:

哪一个是教授的得益 请写清楚

回答3:

求纳什均衡,最后是50%