斯特哥尔堡对策平衡解
斯特哥尔堡对策的最简单的一类对策——单段对策(即静态斯特哥尔堡对策)。 以仅有两个选手的简单情况为例:设选手Ⅰ、Ⅱ分别是“领导”和“随从”,U1,U2分别是他们的策略集。选手Ⅰ和选手Ⅱ有各自的目标函数(损失函数)J1,J2,这都是定义在乘积策略集U1×U2上的标量函数,即  当“领导”首先宣布自己的策略 时,“随从”将选择策略 ,使得 (2) 通常称 为“随从”对“领导”的策略 的合理反应。 假定存在定义在U1上的某个函数T,对于任意U1∈U1,U2=T(U1)∈U2是“随从”的合理反应,那么, (3) 与此相应,称集合 (4) 为“随从”对“领导”的合理反应集。“随从”的最优策略必须根据“领导”的策略U1在其合理反应集R上确定。 对于“领导”来说,当宣布自己的策略时,必须考虑到“随从”的反应以及本身的目标函数。 如果存在策略对(U1sU2s)∈U1×U2,使得 (5) 则称(U1s,U2s)为斯特哥尔堡平衡解。但需注意,U2s必须属于“随从”的反应集R,即U2s=T(U1s)。 由式(2)知,当“领导”选择他的最优策略时,不仅要受到自身策略集U1的限制,还要受到“随从”反应集R的限制。 但是,一般情况下,“领导”并不能准确地知道“随从”的反应集。在这种情况下,有时经过协商,也可能找到平衡解。 |