检验功效
一译“检验的势”。 假设检验优劣程度的度量指标。当零假设不真时拒绝它的概率。用式子表示为:检验功效=P{拒绝H0|H0不真}=1-β。它表示一个检验正确地拒绝零假设H0的能力大小。 好的检验应是犯两类错误的概率都尽可能小。α=P{第一类错误}=P{拒绝H0|H0正确},β=P{第二类错误}=P{接受H0|H0不正确}。要想使α与β同时按需要来设置是不可能的(如图)。图中,曲线A0是在H0成立时的分布,曲线A1是在H1成立时的分布。 μH0与μH1分别是分布A0与A1的总体均值。Zα是右侧临界点。原假设H0的拒绝域是{Z|Z>Zα},其面积(即概率)为α(第一类错误大小);对立假设H1时位于曲线A1以下、Zα点左侧的面积为β(第二类错误大小)。可以看到α取小一些,则临界点Zα右移,必然增大β;若β要小些,必然α增大。 要α与β同时很小,难以办到。通常作法是先固定α,再去考察β。在统计假设中,只有在观测结果与H0“显著不符”时,才拒绝H0而接受H1。在α预定的前提下,要降低β,等价于提高1一β。 检验功效受诸多因素影响,如H1的设置、α的大小、样本大小等。寻找具有最大功效的检验的问题,是推断统计的一大课题。 著名的Neyman-pearson定理给出了构造显著性水平为α的一致最大功效检验(VMP检验)的方法。参见“似然比检验”。 |