字词 | 判别分析 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
类别 | 中英文字词句释义及详细解析 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
释义 | 判别分析 判别分析panbie fenxi判别一个多指标样品属于何个多元总体的统计方法。如有K类不同数学能力水平的被试者, 每类被试者均可用统一的p个测验成绩描述,称作存在k个p元总体G1, G2,……,Gk。若从各类被试中分别随机抽取一组被试者进行观测, 共得k个样本,每一样本均是ni(第i类的被试者数)个p维成绩向量, 于是就可按一定的最优准则建立一个相应的判别规则。以后,任一被试者的p维成绩向量: ☚ 主成分分析 聚类分析 ☛ 判别分析discrimenatory analysis是判别个体所属类别的一种多元分析统计方法。如根据病人的各种症状判别病人患的是哪一种疾病,根据细菌的形态及生化特性判别属于哪一菌种,根据心电图各种波形特点识别心脏病等。因判别准则不同,又分为Fisher与Bayes等判别分析法。 判别分析 判别分析判别分析是判别个体所属类别的一种多元统计分析方法。它在医学上有着广泛的应用。例如,根据病人的各种症状判别病人患的是哪一种疾病; 根据病人各种症状的严重程度预测病人的预后; 根据细菌的形态及生化特性判别属于哪一菌种等。如果所用指标是某种图象的各种特征,则可将此法用于图象识别。例如,根据骨瘤X线片上的各种特征判别骨瘤性质; 根据心电图各种波形特点识别心脏病等。当应用电子计算机来进行分析时,就成为电子计算机辅助诊断,心电图自动识别等等。在判别分析中,因判别准则的不同,又有Fisher与Bayes等不同判别分析法。 图1 两个指标综合示意(判别分析的几何解释) 式(1)称为判别函数。如果指标不是两个而有m个,则判别函数为 Y=b1X1+b2X2+…+bmXm。(2) 有了判别函数就能有效地判别两类个体的归属。有时一个判别函数不能有效地判别多类个体,这时就需要用几个判别函数。Fisher判别准则是要求各类之间的变异尽可能地大,而各类内部的变异尽可能地小,变异用离均差平方和表示。以两类判别为例,即要求: ![]() ![]() ![]() 求得bi后,代入式(2)即得判别函数。 求判别界值Y0:把A类、B类的各指标的均数分别代入式(2)得: 判别效果的检验:若判别函数能划分两类总体,则两类总体的均数不等;反之,则两总体均数相等。 设样本来自协方差矩阵相同的两个多元正态总体,则两类总体均数有无差异可用F检验: 求得F值后,查F界值表得P值,按所取检验水准作出推断结论。当拒绝H0,接受H1,则认为变量的判别效果有显著性,即建立的判别函数有效。 例1 拟研究以舒张期血压和血浆胆固醇含量预测病人是否患冠心病,测定15名冠心病人和16名健康人的舒张压X1及血浆胆固醇含量X2,结果见表1,试作判别分析。 表1 冠心病人与健康人舒张压(mmHg)和血浆胆固醇含量(mg/dl)*
*为便于理解,本例数据经过修改。 (1)求判别函数。计算各类的基本数据及离均差平方和、离均差积和: 按式(5)计算各指标两类内部的离均差平方和或积和的合并值: l11 =2118.93+1015 =3133.93, l22 = 26590.93+19127.94 =45718.87, l12=l21 =-3102.27+(-682.25)=-3784.52。 按式(6)计算各指标两类均数之差: d1=93.7333-79.7500=13.9833, d2=187.9333-141.4375=46.4958。 将上列结果代入式(4)得 解之得 b1 = 0.006321, b2=0.001539。 代入式(2)得判别函数为: Y=0.006321X1+0.001539X2。 按式(7)与(8)求两类的判别界值Y0: (2)检验判别函数的有效性。 H0: μA=μB, H1: μA≠μB。 a=0.01。 按式(10)及式(9)得: 查F界值表得P<0.01,按a=0.01水准拒绝H0,接受H1,故可认为判别函数有效。 (3) 回代。如以A类的第1例X1=74,X2=200代入判别函数,得Y=0.775554 由表2可见两类错判的各有3例,判对的共25例,故符合率为25/31=80.64%。 表2 判别分析与临床诊断结果符合情况
用双指标(X1 、X2)作两类判别的判别图根据(X1、X2)描点于X1X2坐标平面,并在此平面上画出判别轴: b1X1+b2X2=Y0,(11) 此轴将平面划分为A、B两个区域。于是根据观察对象所测得数据(X1,X2)标在图上,根据点子所落入的区域即可判别此对象所属的类别。如图2。 例2 根据例1的结果(经检验判别函数有效),试作判别图,并对某受试者:X1=90mmHg,X2=165mg/dl,判断其归属。 (1)作判别图。以X1为横坐标,X2为纵坐标,并以0.006321X1+0.001539X2=0.801745为判别轴,作成图2的判别图。 将表1的数据依次描点,回代结果可看出A、B两类错判的各有3例,其余均符合,同表2。 图2 判别分析图示法 (2)判别归属。以受试者的观察值(90,165),描点P于判别图,由于点P落入冠心病区,故判断受试者患有冠心病。另一判别法是以X1=90,X2=165代入判别函数,得Y=0.006321 × 90+0.001539×165=0.822825。 例1已算得: ![]() ![]() ![]() ![]() 设有某个体来自G个不同总体之一。我们用L(h|g)表示把实属总体g类的个体错分入总体h类的“错分损失”,相应的错分概率记为P(h|g),则把实属g类的个体错分入他类的“错分平均损失”为 各类互相错分的总平均损失为 式中pg为个体来自总体g类的可能性(即先验概率)。设各类总体都服从多元正态分布,并且各类总体的协方差矩阵相同,错分损失L(h|g)=1(g≠h),则由式(13)可推导得G类中每类的判别函数为 例如某单位研究乳房肿块的计算机鉴别诊断,收集了183例的体检和病史资料,根据5个指标(年龄X1,肿块距乳头距离X15,肿块宽度X18,活动度X21及对侧有无肿块X26)作三类判别。按Bayes准则建立判别函数后,进行回代结果如表3,回代符合率为(23+73+45)/183=77.05%,可见效果不太理想。后又以11个指标作两类判别取得了良好效果,回代符合率达96.72%,见表4。 表3 五个指标三类判别效果
表4 11个指标二类判别效果
判别分析的其他方法 判别分析种类很多,也有非参数的判别分析法。判别分析法过去用于连续变量的较多,如果要用于定性资料,则要用到数量化理论。目前离散变量的判别方法也有很大发展。用Bayes逆概率公式和极大似然法也可以判别个体属于哪一类。有人也把它们归入判别分析。 逐步判别是用类似逐步回归的方法对指标先进行筛选。方法有多种,其中最常用而较简便的是S.S. Wilks所提出的方法,在选出变量后再作判别分析。上述乳房肿块的计量诊断中所用的5个和11个变量就是按Wilks统计量用F检验筛选出来的。 序贯判别是在二类判别时先用一个指标作判别,判别结果可以是“A类”、“B类”或“不定”。当判为“不定”时再用第二个指标进行判别,如此序贯地逐一引入指标作判别。 ☚ 逐步回归分析 聚类分析 ☛ 判别分析 判别分析discriminant analysis这是多元分析中的主要方法之一。其一般表述为:设有M个总体G1,G2,…,Gm,它们具有相同的p个可观测指标Xi,i=1,2,…,p。对于不同的Gi,i = 1,2,…,m,这些指标有不同的统计特性。现假定有一个样本X(0)=(X1(0),X2(0),…,Xp(0))来自这M个总体中,但不清楚其到底来自哪个总体。判别分析就是要通过相关统计知识和经验,去判断该样本究竟来自哪一个总体。解决这个问题的途径很多。常用的判别方法有贝叶斯(Bayes)判别、距离判别、费希尔(Fisher)判别和线性判别等等。对于在实际判断中可能出现的误判情况,解决方法就是要在判别分析中选取一种准则。如选取误判概率或损失,使得误判的概率或误判的损失尽可能小。 ☚ 主成分分析 因子分析 ☛ 判别分析 判别分析discriminant analysis用于判别样品所属类型的多元分析方法。基本原理是按照一定判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标,据此确定某一样品属于的类别。判别问题的提法为: 设有k个已知总体,从各个总体中分别抽取一个样本。另有一个样品,它属于且只属于其中的一个总体。要判别它属于哪个总体。根据对判别问题的不同解释,有三种不同的常用的判别方法: 距离判别、贝叶斯判别和费希尔判别。 ☚ R型聚类 距离判别 ☛ 判别分析 判别分析多元分析的一种。主要用于判别样品所属类型。判别问题的提法为: 设有k个已知总体,从各个总体中分别抽取一个样本。另有一个样品,它属于且只属于其中的一个总体。现在要判别它属于哪个总体。根据对判别问题的不同解释,有三种不同的常用的判别方法,距离判别、贝叶斯判别和费希尔判别。 ☚ 多元分析 因素分析 ☛ |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
随便看 |
|
文网收录3541549条中英文词条,其功能与新华字典、现代汉语词典、牛津高阶英汉词典等各类中英文词典类似,基本涵盖了全部常用中英文字词句的读音、释义及用法,是语言学习和写作的有利工具。