线性模型
确立因变量对于自变量的依赖关系是一类广泛存在而且有重要意义的问题。 在很多情况下,这种关系不能从理论分析中得到,而要利用数据去拟合。在这样做的时候首先要建立模型,模型中含有若干未知参数。 然后利用数据估计未知参数的值,并检验模型的合理性。模型中的未知参数业经求出并通过检验,就可利用模型进行预测。 一类很重要的模型是具有线性结构的模型,称作“线性模型”。 把因变量记作y。 设自变量有k个,x1…,xk,fj(x1m,…,xk)为已知函数,j=i,p。设y与x1,…xk之间具有关系: 其中 ,是未知参数。 当自变量x1,…xk取得观察值时,fj(x1,…,xk),j=1,p,便成为已知的数,问题是要利用观察数据求出未知数 。设一共进行了几次观察,在第i次观察中,自变量的值为x11,…,x’ki,因变量的值为Yi。在观察中总会有无法控制的随机误差,如果所建立的模型正确,则观察值之间有下面的关系: (1) 其中ei是第i次观察的误差,是随机变量。既然 是由观察值确定的已知数,为简单起见,记作xij, , ,则(1)成为  对于观测误差常根据问题的实际情形提出一些假设,常见的假设有以下两种: (1)设e1…,en独立同分布,且Eei=0,var(ei)=σ2,0<σ2<∞,σ2未知, (2)e1…,en满足(1),且它们共同的分布是均值为0的正态分布。 记  则(2)可简化为 Y=Xβ+e (3)(或(2)或(1))称作线性模型,这里的线性是针对未知参数 而言的,未知参数 以其线性函数的形式出在在模型中。σ2也是模型的一个未知参数。求解线性模型的任务有两方面,一是估计 及σ2;二是关于参数βj的假设检验。 |