在一个十字路口中,有朝<南北>< 东西>方向四个交通控制灯,假设这个十字路口的车只能南北东西行使。
问题: 显然,当南北的交通灯=red时,东西的交通灯=green。反之亦然。
那么,如果以每个方向上的两个交通灯为一个agent,(设南北方向agent初始状态=红灯)agent以保持红灯或是变成绿灯为两个不同的策略。(agnet之间是完全信息的,有共同的知识库,经验集,)那么如何选择博弈方式以计算,使此路口的情况保持平稳良好的均衡解。每个agent的决策都对应着一个交通状况的relative complex的赢得值。
是把整个动态过程分成N个决策点,两个决策点之间有决策Act的时间。然后每个周期用策略型博弈,进行占优DES?
剔出劣策略?IDE? 安全策略?
是看成零和?还是非零和?
合作?非合作?
或是干脆看成一个动态的完全信息的stackelberg博弈,
或是一个扩展式博弈用反向归纳法得到反向归纳策略组合?
我晕了?
另外,进化博弈中的路径学习是否可以使用,如果使用混合策略以求得那是均衡解的时候?