| 释义 |
极小的最大懊悔Minimax Regret决策理论中不确定条件下做出决策的一条规则。在不同的性质状态和能够采取的各种行动方针给定的条件下,极小的最大懊悔原理规定了我们选择 “懊悔” 的标准。即事实上的收益与假如选择了正确的策略会获得的收益这两者之间的差额。附图所示矩阵中的数据,首先塑造了一个懊悔矩阵。附图所示:
| | | | 行动 | | | | | | 1 | 2 | 3 | 4 | | | 1 | 1 | 0 | 4 | 2 | | 状态 | 2 | 2 | 3 | 5 | 7 | | | 4 | 2 | 5 | 2 | 0 | 如果出现性质状态2,我们选择行动方针2,得益为2。但是假如我们选择行动方针1,则得益会是5,所以“懊悔”为5-2=3,现在我们力求使最大的懊悔极小化。最大的懊悔在懊悔矩阵中被用黑体标出。极小的最大懊悔便是行动3,其损失为2,所以极小的最大懊悔是一条“谨慎”的原则,它保证了出现最坏情况下我们做了 “坏事中的最佳行动”。 |