|
关于我国数理统计学发展中存在的几点思考 2005-04-12 陈希孺 关于我国数理统计学发展中存在的几点思考 解放以来特别是改革开放20余年来,我国在发展数理统计学方面取得了很大的成绩。 同时我们也很清楚,与先进国家相比,我们仍有一段不小的差距。我们不难列举出这一 差距的种种表现。笔者认为,差距的存在不是主要问题。重要的在于“运行机制”(借 用一个流行的经济学术语)。“机制”对了。学科的发展走在正确的道路上,进入“良 性循环”,弥合现有的差距就不是难事。 8 W, j9 ?3 A6 Z& A5 U9 c1 [' F
日本可以作为一个例子,从时间上说,日本在这个学科上起步不比我们早。大致上, 日本的数理统计学是二战后“从零开始”发展起来的。时至今日,虽然日本在数理统计 学的理论研究方面并未有给人深刻印象的建树,但在应用和方法研究方面,其成就得到 国际公认,有些成果有很大的应用价值,如大家熟悉的正交表,赤池关于模型选择的AIC 准则及田口关于试验设计的工作等,其在应用上普及的程度也肯定属于国际领先,以至 有人估计,在日本战后的“经济奇迹”中,数理统计方法的应用占了5%的份额。而这也 不过经历了二三十年的时间。笔者认为,这些成绩的取得,得力于日本统计学家在研究 工作中的应用取向及优良的外部环境。这后一点指的主要是全社会上下对数理统计方法 的重要意义的认识和接受。这构成了数理统计学科发展 “良性循环”的基础。下面我 们还将回到这个问题上来。 9 u' _* v$ s7 x# J+ r1 I
妨碍我国数理统计学发展的主要因素是什么?这是一个在数理统计学界内部常常议论 的问题。有一个论点得到不少人的认同,即认为由于我们把数理统计学看成数学的一个分 支,采用发展纯数学的方法去发展数理统计学,特别是在成果评价方面,宣理论轻实用。 这种“政策导向”使许多数理统计学者对实用问题不感兴趣。研究内容流于空疏,无补于 实际。因此也就难于获得社会的支持。这一切使学科发展的“良性循环”无法形成。 9 B) C$ X& R& @* V2 R
这个论点言之成理,笔者也是基本上赞同的。但是觉得,我们还应该往深处想一想: 为什么会形成这种局面?如何才能改变这种局面。我觉得,这里面有历史和现实的原因, 并非全是我国数理统计学工作者的责任。但是,也有我们自身的问题。 3 P# S; {! B+ k6 v
数理统计学的学科定位问题,对这门科学发展的影响,其实并不如通常所认为的那 么大。数理统计学发达的国家如美国、英国等国,不大议论这个问题,在具体处理上也 是不拘一格的。比如,有的大学统计学科是设在数学系内,也有分立的,纯数学式的统 计研究工作也末受到排斥,而这些并末影响这门学科的健康发展。但这有一个前提:数 理统计学的应用和方法研究上一直占主流的地位,这一点从未引起质疑,数理统计学的 应用价值得到社会广泛的确认。而这又保证了这方面的研究工作得到应有的评价,不至 于发生在我们这里不时提及的,颇带人为性的“评价标准”的问题。笔者觉得,这些问 题在我们这里尚未得到很好的解决,而这是更有实质意义的差距。
& t! i4 U! v0 h& ~5 R1 D( }有一种观点认为数理统计学是一门 “实验科学”(Experimental Science),即如 物理学、化学等那样,它的成果的确立不是依靠逻辑的推导,而要经受实践的检验,笔 者认为,这是基于数理统计学的下述重要特点:在一般情况下,数理统计学对问题所提 供的解,从应用的标准看,不但没有唯一性,也不存在一种公认为最忧的解,你估计一 个参数,检验一个假设,可以有很多方法,它们都可能在某种条件下(如误差符合某种分 布),在某种标准下有优良性,但这种条件在给定的问题中是否满足,所设的优良性准则 在给定的问题中是否恰当,往往有疑问,这使对数理统计工作的评价一般难于在理论上 确立,而必须诉诸实践的考验。这是数理统计学与其他应用数学分支在性质上的一个重要 差别。比如,运筹学是一门应用数学,其中的问题在一般情况下有唯一的解,明白了这一 点,就可以理解为什么无论从当前或从历史上看,获得高度评价的统计学家和统计工作, 没有不是在方法上和应用上作出重大贡献者,也可以明白,为什么无论从当前或从历史上 看,方法和应用(包括交叉学科)方面的研究始终是数理统计学研究工作中的主流,拿这一 点来衡量我国数理统计学研究工作的现状,确实还存在很大的不足之处。
( W6 P! L* I% g7 \% d前面提到学科发展形成“良性循环”的问题。笔者认为,要解决这个问题,固然与外 界环境的改善不无关系,但作为我们数理统计学工作者自身,其应着力的关键之点,也正 在这个地方,即大力加强方法和应用方面的研究,为社会作出实在的贡献,这样才能增加 本门学科的“显示度“,使社会认识这门学科的重要性,从而获得更大的支持,这就改善 了学科发展的外部环境。在市场经济的条件下,像数理统计学这样有很强的应用性的学科 ,如果没有一定的“显示度”,仅空洞地呼吁其重要性是不能解决问题的,经费问题是如 此——看看数理统计学发达国家的情况可以明白这一点:充裕的经费支持了大量的方法和 应用研究,也有余力支持一些与应用关系不那么密切的理论研究。就是成果评价的标准问 题,也与这一点有密切的关系。
& @$ A6 v+ F: T这就回到了本文开始时提到的那个“机制”问题。确实,我们现在缺乏一个使数理统 计学能得到快速发展的良好机制,研究经费的困难,成果评价标准的不合理,研究工作取 向的偏差和人才流失等,都是这一点的反映。认为造成这一切的一个重要原因,是把数理 统计学当作一个数学分支及由此派生出的一些后果的观点,也有其表面上的合理性。但笔 者坚信,其更深层次的原因,还在于上面谈到的“缺乏显示度”的问题,而这一点,正是 我们中国数理统计学工作者应该致力的方向,当然这里也有一个外界环境的问题。但如前 面所论述的,这外界环境的改善也与我们自己的努力有关,不是可以坐等得来的。 " `# B* ^* p% j' Z
谈到我国的数理统计学理论研究工作,在此,我们姑且把这种工作定义为既不包含分 析统计数据的方法,也不针对一个特定的应用课题的工作,笔者认为,当前存在的问题, 一是从研究队伍的结构看,这部分占的比重偏大,虽然近年来情况开始有所改善,但还未 得到根本的扭转。这里的问题,当然不是通过什么措施来人为地调整这个结构,这个状态 的形成,有其历史和现实的原因,根本的转变非一朝一夕之功。何况从绝对数量看,我国 从事数理统计理论研究工作的人数与先进国家相比,仍是少得多,调整队伍结构,应着眼 于“增量”而非“存量”,即形成一种机制以引导后来者多投入到方法和应用的研究中去 ,这一点在前面已有论及。
; v c M Q0 ]$ A+ v. l& k5 X当前存在的另一个主要问题,是理论研究工作的质量问题。这个问题当前在我国表现 很突出,且是我们数理统计学者自身能够有所作为而不是很受制于外部环境的方面,故尤 其值得引起我们的重视。 9 `( o# C3 S9 Q4 H, }
美国著名统计学家Tukey1962年发表了题为“数据分析的未来”的长篇文章,其中论 及对数理统计工作的评价标准。他提出,首先要看其对分析数据工作有无直接或间接的作 用。这“间接的作用”,就包含理论研究工作在内,其大焉者奠定学科的理论框架,为学 科的发展、揭示新的方向或思路,或开辟新的研究分支和领域。费歇尔、奈曼和瓦尔德这 些大师们的彪炳史册的工作,是这方面的典范。如费歇尔在1921年发表的题为《理论统计 学的数学基础》和1925年发表的题为《点估计理论》的文章,虽则并末提出新的统计方法 ,但其中所提出的概念和理论框架,主导了以后许多年的数理统计学的研究思路(如相合 性、有效性、“似然”概念等),其影响延续至今,以致上世纪末国际统计界在回顾20世 纪数理统计学发展的历程和展望未来的发展方向时,还有一些人提出挖掘费歇尔的统计学 遗产的问题。这些大师们的顶级工作,不是常有。以此作为标准来要求,未免是不切合实 际。但近来也有不少统计学家提到,当前数理统计学的发展,面临一个突破的契机。原因 是由于科技的发展及人类收集数据能力的提高,给数理统计学提出了愈来愈复杂的数据处 理问题。这种问题,如果仍在现行的数理统计学规范(大致说,这是指统计方法基于概率 理论这种规范)下去处理,多显得力不从心,亟须有新的思维和新的理论,以建构新的框 架,从这种观点看,数理统计学的理论研究工作,仍是一个大有可为的事业。 + a5 D/ n" @0 T8 `2 C5 \
Tukey所说的数理统计学理论成果对数据分析的间接的意义,依笔者的理解,大量的 经常性的方面体现在对方法的支撑上,虽然从实用的层面我们不妨把数理统计学看成一门 “实验科学”,一个方法只要在实践中证明了其有用性,就有存在的价值。但这不应理解 为不须对其理论根据进行探讨,如果我们通过理论上的研究阐明了该方法的理论根据,它 的应用条件,优良性,与其他方法的对比以及可能改进的途径,则不仅富有认识上的意义 ,也有实用的意义。能在这些方面有所建树的理论研究工作,就是好的工作。可以举一个 具体的例子。设为估计某一参数(向量)β,引进了估计量β。并在一定条件下证明了其渐 近正态性 (此处因为数学符号无法表示省略有关公式) . c& `! t& D+ A
系数矩阵C(9)依赖于未知参数9,因而上述结果还不能直接用于统计推断。一般的做法是 用取代C(9)中的9,而认为仍成立C(9。)(9。—9)一m(o,1),后一形式就可用于(大样本) 统计推断。这个替代在理论上的合法性,在简单情况下容易证明,对较复杂的情况有时很 麻烦,在文献中多置而不论,然而,这个问题在实用上有意义,不能视为是一个学究式 的问题。 " v. _0 m: D1 X4 U1 u
Tukey在他1962年文章中提出,若是一件数理统计学的理论研究工作直接或间接地都 无补于数据分析这一目的,则可以其数学水平去评价它。就是说,能把一个有统计学背景 的数学问题解决得彻底或有本质的推进,有很大的难度。在解决这个问题时方法有独到和 创新之处,这种工作也可以获得一定的评价。Tukey指出:如果一件工作在实用标准和数 学标准上都无可取之处,则这种工作必然很快退出入们的视野而被遗忘。
" H' ] g n* S! c1 y缺乏实用价值但具有数学美的工作,在统计文献中也不乏其例子,如关于收敛速度的 工作。一般,收敛速度只能以数量级的形式表出。例如……之类,其中所含常数无法定出 ,因而无法据此去了解估计量与其被估计值在一个具体的样本量n之下能达到多少,但如 能够在最弱的条件下定出最优的收敛速度,则仍不失为在数学上有意义的工作。又如某个 结果原来是在“误差有界”的条件下证明的,现把它改进为只要求误差有某阶矩存在,这 项工作,从数据分析的方法角度看,并无多大意义,因为在现实问题中,误差总是有界的 ,但如果能证明所定出的矩的阶数已达到最小且具有数学上的深度,则不失为有意义的工 作。
s# m) D' ` H% Y# D( D c9 ^ 检视一下我国数理统计工作者近几十年来所发表的论著,人们不能不感到,那种不符 合Tukey所提出的两个标准之一的工作,占据了不小的份量。我国数理统计界要提升自己在 国际统计界的地位,这是一个应当努力的主要方面,尤其是要重视统计方法的研究,看看 当前数理统计学方面影响因子最高的几种主流刊物,女口JASA,EConomethka,JASS 和 Biometrika之类,所刊载的文章都是以方法研究为重点,就是理论气味最重的统计刊物 ——美国的Annals of Statistics,为迎合重视实用、重视方法的潮流,近年来在风格上 也颇有些变化。当然,对一个具体的研究者来说,其研究风格在或大或小的程度上受制于 自己的条件,不是说一定要去迎合这种潮流,但是笔者认为,如果你从事的是数理统计学 的理论研究工作,则不能忽视Tukey所提出的这两条标准。
, G/ q `& n3 k7 ]振兴我国的数理统计学,寄希望于年育一代,因此培养人才的问题值得特别重视,在 这方面有许多值得考虑的问题。 3 r6 n# D3 y; A; u9 d3 g
笔者1980年曾在美国一个大学的统计系工作过近2年,就近观察过他们的教学情况。 他们课开的门数比我们多,学生能有机会接触统计学更多的领域,每门课的课时不多而用 的教本并不浅。例如时间序列分析这门课,用的是BrockweU和Davis合著《Time Series: Theory and Methods》,这本书篇幅大,内容深,即使具有较好的数学和概率基础的人, 要读懂也要费一把劲,但这门课只上15周,每周3学时,因为在课堂上老师不讲证明推导 ,而只讲概念和方法。然后布置大量的习题让学生在下面去完成,这些习题都是来自各种 领域的真实的应用课题,附有大量的数据,要使用软件在计算机上完成。记得当时在该系 的几位中国留学生经常在机房工作到清晨一、两点钟,就为完成这些习题。通过这样一种 方式的学习,学生能比较熟练地掌握在实际中常用的一些时间序列分析方法,并能将其用 于解决工作中碰到的问题,这种教学方式比较适合数理统计专业这样一个特点:其毕业生 绝大多数都要到实际部门工作,对于他们,多学会一些方法并熟悉其应用是首要的,至于 理论,基本上要靠学生的自学。在大量的学生中,总会有一少部分数学和概率基础较好且 对理论感兴趣的人,对这种人,如果有一本好的教科书或参考书,理论部分不难自己补上 ,这一部分人中相当多的也会进入研究生阶段的学习,在那里也还有机会补上,他们将来 有条件从事数理统计学理论和方法的研究工作,或在高等学校任教。因此,这种教学方式 起了一个“分流”的作用,不是把学生都培养为一个模式的人。 0 y( W! a( @2 F `9 B) C9 |
我们则与此相反,课堂教学务求仔细,要求一切问题都在课堂上解决,但由于授课时 间有限,只好压缩内容,这种教学方式不给学生留下思考的余地,不利于发挥学生学习的 主动性,也不利于培养学生刻苦钻研的精神。求学好比游公园,老师的作用好比导游,导 游指点一个大略,提醒一些值得看的地方,真正的妙处所在,还得自己用心领略,一切依 靠导游,难有真正的收获,这种教学方式还起了一个人为拉平的作用,使资质好的变成平 庸,而平庸的也无所长进。 3 ]# d/ V, l* |% E" X+ X
教材方面问题也很多,主要是老化,跟不上学科的发展。近几十年来数理统计学有不 少有意义的新进展,目前在教材中还很少有所反映,这也与教学方式有关,讲得过细,要 使学生不大费力就能接受,就不可能容纳更多的东西,讲者也习惯于用旧有的教材和老的 方式去讲授,因为这样做更省力。
3 |- S3 M1 l* ^在研究生培养方面,一个突出的问题是过于重视论文而忽视了学科知识的广度和深度 ,造成所谓“硕士不硕,博士不博”。有的统计学先进的国家,硕士不必有论文,博士虽 要求有论文,但不必在答辩前公开发表。在我们这里,博士3年,要求在答辩前至少在相 当级别的刊物上发表论文2篇以上,有的还要求上SCI,这样“急就章”赶出来的文章,其 水平如何,可想而知;更有甚者,不可讳言,如今研究生招生规模急剧扩大,质量就难以 从严要求。有的研究生刚入学时,对本门学科尚未充分入门,这时即要求他开始写文章, 岂非强人所难。有的甚或不能不基本上由导师越chu代庖。由于这方面要求紧且有时限, 只能把主要精力投入这一方面,实际收效不大,而把课程学习荒废了。所以,在这一点上 亟宜有所改进。以上的议论,当然不是放松要求,而是表明笔者对“学位”的一种看法。 笔者认为,不应以成熟学者的标准来要求博士。博士学位,关键还在于“博”,即能通晓 本学科的全貌,打下较深厚的学问根基,初步掌握治学的方法,不在一时有多少表现,而 在于后劲,缺乏后劲,将来就走不远,也就不能真正成才。
* c, S" I) u! U+ q- b( i& q5 T本文发表的见解,只是根据笔者所见所闻及历年治学的经验教训,不一定都妥当,但 笔者相信,这些都是值得重视的问题,关系到我国的数理统计学能否健康发展,希望能引 起同行们的关注、批评和讨论。
4 N0 N6 y* p' \! e 陈希孺,1934年2月11日生于湖南省望城县,1956 年毕业于武汉大学数学系,后就职于中国科学院数学研 究所。1961年到中国科技大学从事数理统计教学与研究 工作至今。陈希孺1980年任教授,1981年任博士生导 师,1997年当选为中科院数理学部院士,现担任中国数 理统计学会理事长及中国统计学会副会长等职。 9 S" I% y9 O: J5 \8 p9 |$ t
[upload=bmp]UploadFile/2005-10/会战200510511212459245.bmp[/upload]
|