生物统计学和医学统计学
十八世纪以来,生物学家试图通过变量分析的方法来探讨遗传的规律; 医学家则应用数量分析的方法来总结临床经验、指导科研工作,出现了以数理统计方法为基础的生物统计学和医学统计学。
法国的鲁易斯(Louis,P. C. A. 1787~1872)是最早应用统计方法进行临床医学研究的医学家。鲁易斯从事肺结核和伤寒的研究,1825年发表《痨瘵的病理解剖研究》(Recherches Anatomicopatholog'ig'ues Sur la Ph-thisie),他以123例病案为根据,其中有50例尸检发现;他的伤寒病研究(1829)是以138例病案为根据,其中有50例尸检发现。鲁易斯通过数字以图表来总结临床观察资料,这种总结方法至今仍为人们所采用。
麻夫尔于1733年发表常态曲线方程,当时他未想到将这个结果应用于实验观察数据。由于他的论文湮没无闻,他的常态曲线方程也未为世人所重视。后来,拉普拉斯和高斯又各自独立地推导出这个方程。首先应用常态曲线方程于生物学观察的学者则为比利时的凯特莱,他列举了苏格兰军团的士兵的胸部测量和法兰西新兵的身高,表示测量数据呈常态曲线分布。
应用数学方法研究生物遗传特性的首推奥地利的孟德尔(Mendel,G. J. 1822~1884),他根据豌豆性状遗传的定量规律,提出了著名的数量遗传学基本模型与定律(1865)。英国的高尔顿(Galton,F,1822~1911)发展了这项工作,他于1869年发表《遗传之特征》(HereditaryGenlus)一书,是应用生物统计法研究人类遗传特性的代表著作。高尔顿首先应用“回归”(regression)这个名词,他指出人类遗传特性具有向中心回归的趋势,他以人体的身高为例,认为生物的遗传特性总是要回归到种族的均数。按近代回归的意义,指的是当第二种变量(自变量)的引入,能使第一种变量(因变量)的偶然性的内部变差缩小,表明这两种变量间存在着回归的关系。1875年高尔顿用统计方法规画出最早的回归线,他又用量变表示两种性状之间的相互关系,引入了“r”作为“相关系数”(correlation coefficient)的符号,并于1889年出版了第一个相关表。
英国伦敦大学数学物理学家皮尔逊(Pearson,K.1857~1936)是对数理统计作出巨大贡献的学者。皮尔逊于1899年提出“x2(卡方)检验”,他把x2作为一个实际频数与理论频数之间的偏离度的判据,迄今用x2的分布对属性进行检验的方法已普遍地应用于科学研究中。皮尔逊著《科学规范》(Grammer of Science 1892)的第三卷是以统计方法研究生物学的专论。皮尔逊于1899年创办生物统计杂志(Biometrika),前后任事达35年之久,通过这份杂志,使生物统计学与遗传统计方法获得巨大的发展。
皮尔逊主要致力于大样本的研究,但对科研和生产单位来说,要取得大样本资料存在有实际困难,于是小样本统计推断理论就因客观需要而建立起来。在酿酒厂任事的皮尔逊的学生哥赛脱(Gosset,W.S.1876~1937)于1908年在Biometrika发表了一篇重要论文,当时他应用“Student”作为笔名,于是人们将他创导的方法称之为“Student's t检验”法,此法已成为目前数理统计学家以及实验工作者的一种基本工具。
二十世纪最优秀的生物统计学家费希尔(Fisher,R.A. 1890~1962)和他的学生将数理统计方法广泛应用于农业科学、生物学和遗传学,从而使数理统计方法在理论上和应用上得到长足的进步。费希尔于1925年发表《研究工作者用数理统计方法》,被认为是近代数理统计学的开始。1928年费希尔发现方差分析,这种方法在变差的来源或原因和实验设计中起了很大的作用。1935年费希尔又刊布《实验设计》(The Design of Experiments)一书,使人们在最小的人力物力和时间条件下获得最多的情报和资料。他所提出的“重复、随机、对照”三大原则,至今仍被人们认为是保证试验结果正确性的原则。费希尔所创制的随机化,为人们进行实验时提供了机会均等的方法,大大减少实验中的偏倚。通过近代学者的一系列工作,显示了数理统计方法在科学研究工作中的重要意义。
近代医学和生物学正从定性转入定量的研究。科学工作者对各种作为现象的判据用的变量进行精细的量测或计数,在定量的基础上对相应的现象作出更为精确和更有把握的估计和推断。数理统计方法就是在掌握偶然现象的规律性的基础上,利用机率来探讨样本和全体间的关系,从而使科研人员可能作出比较正确的结论。近代科学的发展表明,生物统计、数量遗传对生物、农学、医学的发展起了重要的作用,可以预期,数理统计方法对于今后科学的发展必将起到越来越重要的作用。