字词 | 因子分析 | ||||||||||||||||||||||||||||||||||||||||||||||||||
类别 | 中英文字词句释义及详细解析 | ||||||||||||||||||||||||||||||||||||||||||||||||||
释义 | 因子分析factor analysis见“因素分析”。 因子分析factor analysis多元统计分析的一个分支,用来研究一组指标的结构,其主要目标是降维,即降低用来刻画事物状态的指标的维数,以使对事物状态的描述更概括和简洁。在对实际问题进行研究时,把注意力集中于利用P个指标来构造几个不相关的具有最大方差的新指标,舍去那些 “贡献”很小的指标,从而降低所考虑问题中的指标的维数,使问题变得简洁。而因子分析方法则试图通过用最少个不可观测的变量 (即公共因子)来说明这些可观测的P个指标的相关模型,从而进一步简化模型。为了不失一般性,不妨假设Xi,i=1,2,…,p是零均值和单位方差的,方程式 因子分析 因子分析医学研究中经常遇到多指标的问题,例如描述牙槽弓形状特征可用22个指标。指标多会增加分析中的麻烦。事实上,不同指标之间往往有一定的相关性,因此有可能用较少的综合因子来代替原来较多的指标,使这些较少的因子既能综合反映原指标的大部分信息,而且相互之间可以是无关的。对于这些互不相关的因子,可以逐个地分析它所代表的意义。因子分析就是用以解决这类问题的。通常将p个指标X1,X2,…,Xp (简记为Xi,i=1,2,…,p),综合而成的m个因子F1,F2,…,Fm(简记为Fj,j=1,2,…,m;且m≤p)。例如,按二个指标X1,X2测得n对数据,结果如图中散点所示。 二指标因子分析示意 由图可见,这n个点子的分布有一定规律。这些点子的信息分别由X1、X2来反映,但X1、X2之间又显然有某种程度的相关,即X1增大时,X2也增大。因此若用因子F1、F2来代替X1、X2,也就是用新坐标系F1OF2来代替 旧坐标系X1OX2,则不但可使F1与F2互不相关(F2的大小与F1的大小无关),而且,因为这n个点大多沿着F1轴散开,变异较大,而在F2轴上则变异较小;故F1就反映了X1和X2中所含的主要信息(比如说75%)。这样,只用F1一个因子就能反映原来二个指标所含信息的75%,而F2只反映全部信息中的25%,故称F1为第一主因子,F2为第二主因子。 原理 因子分析有二个基本问题: (1)将指标用因子表达。 ❷Fj的方差(用以反映指标的综合信息量)中,F1的方差应最大,F2的方差次之,依次递减。通常可用主成分分析法来求解。此时所求得的F1,F2,…,Fm又常称为第一、第二、…第m主成分。(2) 将公共因子用指标表达。式(2)的系数矩阵为式(1)中Fj的系数矩阵的转置矩阵。任一观察单位的各指标值代入式(2)就能求得各Fj值,它们可称为该观察单位的因子计量或因子得分,是从所有原始指标中,把与某一特定的因子有关的信息集中起来,必要时可利用因子计量作进一步的统计分析。 方法 (1)设有n个观察单位,各调查p个指标X1,X2,…,Xp,得数据排列如表1。 表1 p个指标的观察值
(2)将各Xi标准化,即各Xi分别减去其相应均数i并除以其标准差si,记为xi=(Xi-i) /si。 并求其两两相关系数,列成相关矩阵。由相关矩阵,用线性代数中的运算方法求得其p个特征根,从中选取m (m≤p)个λj (j=1,2,…,m)。并规定λ1≥λ2≥…≥λm,从而求得各λj的标准化特征向量lij。 (3)按式(3)计算式(1)中的aij (4)计算所取的m个主因子F1,F2,…,Fm对某Xi的贡献Vi (5)式(1)中单一因子Ui的系数ai,其平方值a2i即为Ui的方差,可用下式求得。 a2i=1-Vi,(5) 式中a2i表示m个主因子对指标Xi未能反映部分的信息量。 (6) 为使每一个公共因子只和最少数的指标有相关关系,必要时可进行因子旋转。 几个常用术语的意义: (1)特征根λj体现了某一主因子Fj对所有指标Xi(i=1,2,…,p)总的贡献。因此, ![]() (2) ![]() (3) aij称为因子负荷量,它体现了某一主因子Fj对某指标Xi的贡献(即Fj反映Xi中所含信息的量)。 ![]() 因子分析分为R型和Q型两类。如上所述,从指标间的相关矩阵出发,提取指标中的主因子,称为R型分析。若从观察单位间的相关矩阵出发,提取观察单位中的主因子则称为Q型分析。在临床上,前者常用于对因子所代表的病因作分析和解释,后者可用于找主因子所代表的典型病例。 例 为了研究牙槽弓的形状特征,某单位调查了609例全口缺牙病人,每个患者各测22个指标Xi,分别反映上下牙槽弓的宽度、深度与长度。试用少数几个综合因子来概括这22个指标所反映的特征(本例仅考虑公共因子)。 (1)将各Xi标准化后,计算其两两间的相关系数,并由相关矩阵求出22个特征根及其累计贡献率见表2。 表2 累计贡献率的计算(节录)
(2)结合专业知识,可见仅取λ1,λ2与λ3三个特征根其累计贡献率已近70%。这就是说仅取三个因子F1、F2与F3就体现了原22个指标中所含信息的70%。由λ1、λ2与λ3可计算得相应的标准化特征向量,见表3。 表3 三个主因子的标准化特征向量lij 由表2、表3按式(3)可求得各因子负荷量aij,见表4。 表4 因子负荷量及累计贡献率
(3)据各因子负荷量aij,由式(4)可求得三个主因子对各Xi的累计贡献率Vi见表4最后一栏。由累计贡献率可见,取三个主因子时,对各指标的贡献已相当大,其中以对X3、X4、X5、X7、X ![]() ☚ 聚类分析 正常值范围 ☛ 因子分析 因子分析把众多变量减少为含有一组相关的原始变量的少数因子的一种统计学分析。一个因子表示一系列数值的“负荷量”,它表明该因子与每一原始变量的相关水平。这样,一个因子便可解释高负荷量的原始变量,研究者即可对具有高负荷变量的特性进一步展开探讨和研究。每个因子仅仅是统计的产物,以某种计算机的程序表示了原始变量之间的相互关系。但因子本身常被看作是变量。它们的本质源于具有最高相关的原始变量的特性。例如,原始变量可以是157个联合国成员国在100个国际问题上的投票行为,这样,投票数可由一个100个垂直栏目和157个水平栏目的表格表示。运用因子分析,可以有效地将栏目数由100个减少到12个左右,新栏目表示对每一国家拥有一个数值负荷量的因子,而每一数值负荷量又表示与某个特殊水平或特殊因素相关的某国投票行为的机率。如果高负荷量的国家都是西欧国家,则可贴上“西欧”水平标签,而别的因子也可能仅对东欧国家显出高负荷量;另一因子则可能表示了另一些没有明显的共同特征的国家。因子分析只是显示了这些统计关系;对这些关系的解释还需人们的进一步研究。因子分析的主要优点是能把大量资料和数据减少成容易处理的几个部分,并提出不太明显的变量之间的关系的假设。 ☚ 考斯特分析 因径分析 ☛ 因子分析 因子分析factor analysis最初由斯皮尔曼(Spearman,C.)1904年提出。这是一种多元统计分析方法,其目的是为了减少用于描述事物状态的指标的维数,从而易于概括出该事物的本质。例如,在用p个指标Xi(i=1,2,…,p)描述事物的状态来研究一组指标的结构时,可以通过用尽可能少的且不可观测的变量(公共因子)来描述这些可观测的p个指标的相关模型,以便减少所考虑问题中的指标维数。 有关因子分析的理论和模型目前还不是很完善。比如,载荷矩阵C=(Cik)不具惟一性,它可用矩阵CM替代(M是正交矩阵)。这就需要在实际中选择合适的M,来简化因子结构,以便能更好地解释其结果。 ☚ 判别分析 计量经济学杂志 ☛ |
||||||||||||||||||||||||||||||||||||||||||||||||||
随便看 |
|
文网收录3541549条中英文词条,其功能与新华字典、现代汉语词典、牛津高阶英汉词典等各类中英文词典类似,基本涵盖了全部常用中英文字词句的读音、释义及用法,是语言学习和写作的有利工具。