混合策略
指不存在最优纯策略的二人零和有限对策,称混合策略问题或非确定型对策问题。 混合策略一般是这样描述的: 给定矩阵对策  把纯策略集合对应的概率向量  分别称为局中人A、B的混合策略,x1,yj分别表示局中人A、B选取α1,βj的概率。 将数学期望  称期望支付,即在混合策略下局中人B对A的期望支付。对任何支付矩阵都有:  称对策中的极大极小值定理。 如果 则称V值为对策G的值,混合局势( ,y*)称为G在混合策略下的解,而X*, 分别称为局中人A与B的最优混合策略。 在这种情形下,局中人决策时,不是决定用哪一个纯策略,而是决定用多大的概率去选取每个纯策略;对策值也不是一个确定值,而是一个期望值。 |