数据窥探data mining
数据窥探是一种建模法,具体说,是指抛弃理论模型,以充分描述特征的向量自回归模型或向量自回归移动平均模型为计量模型之基本形式。数据窥探的含义很宽,至少有三层。首先,数据窥探可指建模者为证实某先验理论而去专门发掘有关数据的做法。显然,这种数据窥探不一定都不合理,只有当建模者为了证实某先验理论而有意掩盖或抛弃与理论相悖的数据时,这种发掘才不可取。其次,数据窥探也可指建模者为了使计量模型通过一系列统计检验而反复修正模型形式的做法。只要建模者将这种做法明朗化、严谨化和系统化,它便是可取的。应注意避免对统一检验手段的双重使用,即凡用于建模标准的检验就不应被再用作理论的实证之据。再此,数据窥探还可以指建模者对依据约化理论筛选出的计量模型结果过于信赖的做法。这里的关键在于如何衡量这种信赖度。总之,数据窥探并不一定是不科学的,其可能不科学的成分都源于建模者对经济理论与计量模型的连接关系处理不当。凡是忽略了可能与理论相悖之数据信息的计量模型是肯定无法包容其他对立模型的结果的。