2012年国赛数学建模C题-模型建立及求解 ) z/ J- q- Q) |" ]
% D7 h+ _' m3 t4 ~2 r2 A9 s
4 u$ s* n4 j* I2012高教社杯全国大学生数学建模竞赛C题 --模型建立及求解 4.1 针对问题一的模型建立及求解由问题分析可知,这属于多信息变量的统计描述模型,该问题主要是对脑卒中发病者信息进行统计描述,其方法是分别对脑卒中患者病历信息——性别、年龄、职业、发病时间进行统计,全部操作在EXCEL中进行。 4.1.1 附件数据的修复处理由于附件中的患者病例信息有许多格式错误及信息不完整,在进行统计描述前,有必要对数据做修复处理,本文的修复过程及方法如下: 1. 年龄(Age)字段中存在大于110岁(如799)、0岁的信息,本文处理方法为将区间[1 110]之间的数据作为有效值,其余的全视为该患者年龄信息缺失。 2. 职业(Occupation)字段中存在1-8之外的数据(如9、工等异常),可能是数据录入错误,也可能是还有其它类的职业没在附件中说明,本文处理方法为将1-8之外的数据视为其他职业段。 3. 发病时间(Time of incidence)字段存在日期格式错误(如15-06-2008、20080620等)或与EXCEL标准时间格式(如2007/1/1)不统一,需要对时间数据进行修复及标准化处理,处理原则有以下几点: ① 类似“2009-0-24”的数据丢失了月份信息,此类数据认为是错误数据,不统计在2007~2010期间内; ② 类似“发病时间为5008/7/31、诊断报告时间为27/09/2008”存在明显错误的数据,5008应该修复成2008; ③ 类似“31/12/2009”的数据不是EXCEL标准的时间格式,为了便于在EXCEL中快速按年、月、日进行统计分析,有必要对非标准的日期数据进行标准化处理,其方法可以通过在一单元格中进行编写公式进行字符串处理,假设“31/12/2009”所在的单元格为“D2”,则计算标准化的日期格式(2009/12/31)的公式为“=DATE(RIGHT(D2,4),MID(D2,4,2),LEFT(D2,2))”; ④ 类似“发病时间为20110/05/09、诊断报告时间为2010-08-08”的数据,直接视为无效数据; ⑤ 类似“2009/0/24”的数据也视为无效数据。 4.1.2 脑卒中患者信息统计分析通过上述数据修复过程后,将得到标准格式的脑卒中患者信息数据,现按照模型分析的思路对脑卒中病例信息进行统计描述,其核心方法是在EXCEL中利用“COUNTIF”函数对某条件进行筛选后统计患者人数、及“COUNTIFS”函数对多重条件进行筛选后统计患者人数,具体操作界面截图见附录B-1。 4.1.2.1 按性别统计对男女性别分别进行筛选,以年为单位,将四年的数据信息进行统计,2007~2010年按性别的脑卒中发病人数统计如表1所示,2007~2010年男女患病人数统计图如图1所示。 表1 2007~2010年按性别的脑卒中发病人数统计表 file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps1.png 图1 2007~2010年男女患病人数统计图 从表1及图1可以看出,2007年男女患者之比达1.23:1,男性比女性更容易患脑卒中这类疾病,可能原因有以下几点:一是男性高血压多于女性;二是男性吸烟与饮酒者多于女性;三是男性从事体力劳动较多,突然用力可能诱发中风。 4.1.2.2 按职业统计按职业字段进行筛选得到2007~2010年各职业患病人数统计数据如表2所示。 表2 2007~2010年各职业患病人数统计表 从表中看出农民患病人数为29750,属于较多人群,为高危职业,而医务人员等明显较低,这与工作强度相关。 file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps2.png 图2 2007~2010年各职业患病人数统计图 可以得出结论:经济收入较高的人群较收入低的人群脑卒中发病率低,户外重体力劳动者发病率较高。 4.1.2.3 按年龄统计针对职业统计中,退休人员所占比例较大说明与年龄有关,对年龄进行筛选,将年龄分为各个阶段,统计出每年中不同年龄段的患病人数,以2007-2008年为例进行如表3所示的描述,各年详细数据见附录A-1。 表3 2007-2008年各年龄段内患病人数统计表 file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps3.png 图3 2007~2010年各年龄阶段的患病人数图 由图3可见,患病人数随年龄的增加而增加,上升速度以50到60上升较快,61岁以上的人群脑卒中的高发群体,集中年龄段在71-80岁之间,说明脑卒中以老年人居多,且脑卒中患者呈年轻化的趋势。 进一步按照各年龄段,对男女患者发病人数的进行区分,可得图4所示。 file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps4.png 图4 2007~2010四年期间各年龄阶段男女患病人数图 可见,男女高峰年龄段一致;男性在41~71岁之间,患病人数明显高于女性;71岁以后患病明显回落,且低于女性发病人数,可知男性发病早于女性,同时这现象可能是由于高龄组死亡率持续增高所致。但无论男女,构成随着年龄增加而增加,这与其在年龄发病相符。 4.1.2.4 按时间统计按年份对发病人数进行统计,得到发病人数统计图如图5所示。 file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps5.png 图5 脑卒中患者按年的统计人数分布 从上图可以看出,附件总数据为61923条,但2007~2010间有效的数据为61885条,本文做的统计描述均是针对2007~2010期间内。 按月份对发病人数进行统计,得到发病人数统计表如表4所示。 表4 2007~2010年各月患病人数统计表 file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps6.png 图6 2007-2010年总发病人数随月份的变化曲线 从2007~2010年逐年脑卒中发病人数的月分布发现,该病以春节多发,高峰出现在3~5月,1月为次高峰,6~9月发病较为平缓,12月出现低谷期。由此可见发病存在一定的季节差异,脑卒中春季高于其他季节,而夏、秋、冬三季发病差异不大。 利用EXCEL中的“COUNTIFS”函数对脑卒中病例数据进行多重筛选统计患者数量,得到2007~2010四年每天的发病人数,其曲线如图7所示。 file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps7.jpg 图7 2007-2010年总发病人数随天的变化曲线 根据式(1)求出2007~2010四年内每天的发病率,其发病率随时间的变化曲线如图8所示。 file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps8.jpg 图8 2007-2010年发病率随天的变化曲线 从图7和图8可以看出,2007~2010四年内每天发病人数变化不大,每天的发病率基本保持不变。但是如果按天进行统计分析,每天的随机误差容易对结果造成影响,再每月的均值作为统计对象进行分析,四年内每月的发病率百分比曲线如图9所示。 file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps9.jpg 图9 2007-2010年发病率随月的变化曲线 从图9可以看出,月发病率随时间呈周期性波动,具有一定的季节性。 4.1.2.5 重要结论(1) 脑卒中的发病有年集中趋势,更呈增长趋势; (2) 发病存在时间差异,春节为高发季,1月为高峰月; (3) 患者人数男性多于女性,性别比重为1.17:1; (4) 工作性质对脑卒中发病有直接影响,农民为高危职业; (5) 脑卒中发病处于老年阶段,集中年龄段为71~80,且逐年呈年轻化发展。 4.2 针对问题二的模型建立及求解由问题分析可知,问题二属于一个多元统计分析模型,目标是研究因变量发病率与自变量温度(包括平均温度、最高温度、最低温度、温度差)、湿度(包括平均湿度、最低湿度)、气压(平均气压、最高气压、最低气压、气压差)之间的关系,本文主要从多元线性或非线性回归模型上进行分析。 4.2.1 数据归纳与统计附件(Appendix-C2)中的数据已经给出了2007-2010年每天对应的气象数据,可以在这基础上对气象数据进行进一步细化: (1)计算每天的气压差与温差,最终得到2007~2010年期间每一天的气象特征信息——平均气压、最高气压、最低气压、气压差、平均温度、最高温度、最低温度、温度差、平均湿度、最低湿度等10个特征变量; (2)按月份统计所有数据中每月的最大值及最小值情况。 最后将第一问进行统计出的发病率情况与气象数据信息进行一一关联,得到最终待分析的数据集,其数据形式如表5所示。 表5 数据归纳统计形式 4.2.2 多元回归分析过程多元回归分析包括多元线性回归及多元非线性回归,判断方法主要通过绘制因变量与各个自变量之间的散点图,首先直观分析因变量与自变量的关系,如果从散点图可以看出明显的线性关系,那么可以考虑通过多元线性回归进行分析;如果从散点图并不能发现明显的线性规律,可能是呈非线性,也可能是多个自变量之间的耦合关系的影响,需要进一步分析才能决定。 4.2.2.1 多元线性回归数学模型若依变数Y同时受到m个自变数X1、X2、…、Xm的影响,且这m个自变数皆与Y成线性关系,则这m+1个变数的关系就形成m元线性回归。因此,一个m元线性回归总体的线性模型为: file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps10.png 式(2) 其中,file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps11.png~N(0,file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps12.png)。相应的,一个m元线性回归的样本观察值组成为: file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps13.png 式(3) 在一个具有n组观察值的样本中,第j组观察值(j=1,2,…,n)可表示为(x1j,x2j,…,xmj,yj),便是M=(m+1)维空间中的一个点。 同理,一个m元线性回归方程可给定为: file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps14.png 式(4) 式(3)中,b0是x1、x2、…、xm都为0时y的点估计值;b1是by1·23…m的简写,它是在x2,x3,…,xm皆保持一定时,x1每增加一个单位对y的效应,称为x2,x3,…,xm不变(取常量)时x1对y的偏回归系数(partial regression coefficient);b2是by2·13…m的简写,它是在x1,x3,…,xm皆保持一定时,x2每增加一个单位对y的效应,称为x1,x3,…,xm不变(取常量)时x2对y的偏回归系数;依此类推,b3是x3对y的偏回归系数;……;bm是xm对y的偏回归系数。 在多元回归系统中,b0一般很难确定其专业意义,它仅是调节回归响应面的一个参数;bi(i=1,2,…,m)表示了各个自变数xi对依变数y的各自效应,而file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps15.png则是这些各自效应的集合,代表着所有自变数对依变数的综合效应。 多元线性回归模型的求解可以直接通过SPSS软件和MATLAB相应的工具求解。 4.2.2.2 按天的数据分析显然,本文中的因变量Y为脑卒中发病人数或发病率或发病率千分比,自变量X有平均气压、最高气压、最低气压、气压差、平均温度、最高温度、最低温度、温度差、平均湿度、最低湿度等10个变量,首先按照每天的统计数据进行多元线性回归分析。 (1)观测发病率与自变量的散点图 以平均气压为例,绘制发病率千分比与平均气压的散点图如图10所示。 file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps16.jpg 图10 2007-2010年每天发病率千分比与平均气压间的散点图 从该图可以看出发病率与平均气压并没有明显的线性变化关系,可能原因是发病率与平均气压的相关性不强,也可能是受其它自变量耦合关系的影响,因为要分析发病率与平均气压的关系必须要在其它指标保持不变或变化很小范围内研究才具有可靠性,因此需要进一步分析。 (2)所有变量两两相关性分析 将表5所示的数据导入SPSS软件中【1】,进行变量之间的相关性分析,所得结果如表6所示。 表6 发病率与10个自变量之间的相关性统计 从表6可以看出,发病率只与平均湿度能通过显著性检验(<0.05),且相关系数都非常低,但总体上发病率与最低气压呈正相关、与最高温度成正相关、与平均湿度成负相关、与温差呈正相关、与气压差呈负相关。 (3)逐步回归分析 从(1)和(2)分析可知发病率从单因素上讲,它与其它自变量的相关性非常小,且无规律可行,需要进行多因素分析,可以通过多元线性回归进行尝试。但是,部分自变量之间又存在很强的相关性,如关于温度的四个指标之间的相关系都大于0.9,因此发病率肯定不是所有这10个特征变量的函数表达式,因此本文采用逐步回归法进行分析。 逐步回归分析的基本原理为:在建立多元回归方程的过程中,按偏相关系数的大小次序将自变量逐个引入方程,对引入方程中的每个自变量偏相关系数进行统计检验,效应显著的自变量留在回归方程内,循此继续遴选下一个自变量。如果效应不显著,停止引入新自变量。由于新自变量的引入,原已引入方程中的自变量由于变量之间的相互作用其效应有可能变得不显著者,经统计检验确证后要随时从方程中剔除,只保留效应显著的自变量,直至不再引入和剔除自变量为止,从而得到最优的回归方程。 对于本文中的逐步回归分析仍借助于SPSS软件的“回归”功能进行分析,设定显著性水平为0.05,逐步回归的模型检验为F=7.555,Sig.=0.006,具体结果如下: file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps17.jpg 图11 逐步回归的Student化残差图 从表7可以看出,所计算的参数的显著性水平Sig.均小于0.05,表示计算回归模型通过了显著性检验,且标准误差也比较小;从图11也可以看出残差图基本落在[-2.5 2.5]内,表明回归模型较好,该逐步回归的多元线性模型为: file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps18.png 式(5) 其中file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps19.png代表发病率千分比,file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps20.png代表平均湿度,这也说明发病率与平均湿度条件直接相关。 (4)气象变量间的相关性分析 由于湿度与温度、气压密切相关,脑卒中发病率虽然与温度、气压没有直接关联度,但温度和气压因素却影响湿度参数,因此以平均湿度为因变量,以平均气压、最高气压、最低气压、气压差、平均温度、最高温度、最低温度、温度差8个特征为自变量进行逐步回归分析,通过已有数据分析平均湿度与温度、气压因素的函数关系。具体分析方法与前面一致,分析结果如下: 表8 平均湿度与温度、气压的逐步回归模型结果 从表8可以看出湿度与温度、压强的线性关系具有两种模型: 模型1: file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps21.png 式(6) 模型2: file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps22.png 式(7) 其中,file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps23.png代表平均湿度,file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps24.png代表温度差,file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml1340\wps25.png代表平均气压,这说明平均湿度与温度差和平均气压相关。 4.2.2.3 按月或季度的数据分析根据表5所示的数据,很容易统计出每月或季度的数据,其中,每月(季)的发病率=每月(季)的发病总人数/该年的发病总人数,每月的气象数据为该月的平均值或最大最小值,关于发病率与气象环境关系的分析方法与前面所描述的过程基本一致。 4.3 针对问题三的求解4.3.1 脑卒中高危人群的重要特征和关键指标4.3.1.1重要特征根据脑动脉狭窄和闭塞后,神经功能障碍的轻重和症状持续时间,分三种类型: (1)短暂性脑缺血发作颈内动脉缺血表现为,突然肢体运动和感觉障碍、失语,单眼短暂失明等,少有意识障碍。椎动脉缺血表现为,眩晕、耳鸣、听力障碍、复视、步态不稳和吞咽困难等。症状持续时间短,可反复发作,甚至一天数次或数十次。可自行缓解,不留后遗症。脑内无明显梗死灶。 (2)可逆性缺血性神经功能障碍(RIND)与TIA基本相同,但神经功能障碍持续时间超过24小时,有的病人可达数天或数十天,最后逐渐完全恢复。脑部可有小的梗死灶,大部分为可逆性病变。 (3)完全性卒中(CS)症状较TIA和RIND严重,不断恶化,常有意识障碍。脑部出现明显的梗死灶。神经功能障碍长期不能恢复,完全性卒中又可分为轻、中、重三型。 4.3.1.2关键指标脑卒中关键指标主要有:职业为农民或工人,年龄在71-80岁之间,并患有基础性疾病(高血压、糖尿病等)。 4.3.2 脑卒中的主要诱发因素脑卒中的主要诱发原因有: (1)具有不良生活方式 ①高危人群的饮食结构不良,多盐、油腻;②体力活动不足;③爱吸烟饮酒。 (2)患有基础性疾病 ①高血压:患高血压史在脑卒中住院病例中,有80%以上的病例有高血压病史,其中脑梗塞82.66%,脑出血80.27%有高血压史 ②心梗、房颤心梗、房颤是引起脑中风的一个独立的强有力的危险因素,与健康人相比,增加脑中风危险度5倍以上,尤其是老年人房颤相当多。 ③糖尿病明显增加缺血性脑中风发生率,单纯糖尿病者,严格控制血糖可减少微血管病变,减缓动脉硬化,从而减少脑中风。 (3)职业性质的影响; 文化程度高的病人自我护理能力强,这可能由于文化程度高的病人,具有更好的学习理解能力,能更好地查阅书籍、报纸、文化程度高的病人更容易接受治疗、康复计划。 (4)年龄阶段因素 中风发生最常见的基本条件就是动脉硬化,随着年龄的增长,生理变化和多种病理性因素相互作用使动脉硬化逐渐产生。 (5)男女性别差异 一是男性高血压多于女性;二是男性吸烟与饮酒者多于女性;三是男性从事体力劳动较多,突然用力可能诱发中风。 (6)季节性差异 脑卒中病人因其机体代谢差,肢体功能活动障碍而活动减少,神经传递障碍使温痛觉减弱或消失,患侧血液循环较健侧差,与季节气温相关。 4.3.3 对高危人群的预警和干预建议(一)结合问题一: 针对1:高危群众发病有年集中趋势,并逐年增长; 建议1: (1)舒缓压力:随着社会经济快速发展,社会各阶层压力过大,社会经济的发展直接影响人们的心理状态,这便是该病集中年患病的体现;文献报道【5】血管疾病的发生与生活事件密切相关,在紧张和过多应激环境中,应激反应可通过垂体引起交感神经兴奋和肾上腺皮质激素增加,使血管强烈收缩血压突然升高而致脑出血。所以减少疾病,应保持身心愉悦,舒缓压力较为重要因素。 (2)合理饮食结构:饮食对身体,当今快节奏的快餐生活方式严重影响了我们的饮食结构,这也是疾病逐年增长的因素。为此建议平日应多摄入低盐低脂类食物,减少油脂摄入,改善血脂异常,改掉不良饮食习惯,因为肥胖与超重均为缺血性中风的危险因素。 针对2:男性比女性更易患病 建议2: (1)戒烟:日常生活中男性一般要吸烟及大量酗酒,而尼古丁可刺激神经系统增快心率及脉率,血管收缩,血压升高长期的血管收缩和血液循环减慢,可使血中胆固醇、低密度脂蛋白沉积于动脉壁,导致动脉硬化【8】。 (2)戒酒:酒精具有增压作用,每日酒精摄入量超过78g的重度饮酒者的高血压患病率是没有饮酒的2倍,酒量与血压水平呈明显的剂量依赖关系。小量饮酒有保护作用,大量饮酒可增加危险性【10】。 针对3:工作性质影响发病 建议3: (1)学会适当休息:即文化程度高的病人自我护理能力强。这可能由于文化程度高的病人,具有更好的学习理解能力,能更好地查阅书籍、报纸、文化程度高的病人更容易接受治疗、康复计划。 (2)增强自身学习能力。 针对4:脑卒中处于老年阶段; 建议4: (1)每天运动30分钟降低4成患病几率:适当的运动会减少糖尿病【13】在于运动能加速对摄入热量的消耗,这样可以将糖份积极转化为有力量的肌肉。每天坚持30 分钟的运动就可以降低患糖尿病的风险35%~40%。 (2)提高自我护理能力:脑卒中病人的自我护理能力受到年龄的影响,年龄增长带给病人的是神经功能缺损程度的加重和致残率增加,从而护理能力与年龄呈负相关【14】。 (二)结合问题二: 问题2针对气温、气压、相对湿度等气候因素进行的干预建议; 针对1:气温 脑卒中病人因其机体代谢差,肢体功能活动障碍而活动减少,神经传递障碍使温痛觉减弱或消失,患侧血液循环较健侧差,室温要求高。 建议1: (1)季节交替时期注意预防;(2)注意保暖防寒,早晚适量添衣,而在白天活动时不要穿戴太多,以防出汗多反而受凉;(3)流感时期可佩挂防感冒香袋,预防感冒发病。 针对2:气压; 低气压使各种过敏原和空气污染物、粉尘等刺激物不容易向高处扩散,而易于向低处散落吸入呼吸道,而且气压聚然降低可使支气管粘膜上的细小血管扩张,气管分泌物增加,支气管管腔变得狭窄容易诱发哮喘。研究发现平均气压偏低(840~907hpa)或偏高(926~971hpa)时,呼吸系统疾病发病率高。 建议2:(1)注意口腔,鼻的清理,保持呼吸通畅;(2)平时要加强体质锻炼,多进行户外活动;(3)注意营养均衡, 对食欲不振患儿要注意脾胃调理; (4)勤洗手,养成良好的卫生习惯【12】。 针对3:相对湿度; 湿度过高,蒸发减少,抑制出汗,使病人感到潮湿憋闷。湿度过低,室内空气干燥,人体水分蒸发增加,引起干渴、咽痛、鼻衄等症状,对呼吸及气管切开者尤为不利。 建议3:(1)当湿度低时多喝水补充人体水分;(2)保持室内空气流通,每天至少通风半小时以上。 一、 模型检验由于第一问和第三问都不涉及到模型检验,因此模型检验主要针对第二问。本文第二问的模型是多元线性回归模型,所用的回归方法是逐步自回归法,该模型的检验方法为将用2007~2010年的发病数据按照式(5)进行回代检验,计算回代结果与原来统计的发病率千分比数据的绝对距离,在总共1461条数据中,绝对距离小于1的有1257条数据,所占比例为86%,表明该模型较为合理。 二、 模型评价6.1 模型优点1、本文模型比较注重数据的处理和存储方式,以表格、图形形式呈现,大大提高了查询效率。 2、论文给出了大量图形,条分缕析,虽直观易懂,但推理严谨,深入浅出,结果准确。模型可操作性强,推广应用起来也很方便。 6.2 模型缺点与改进1、在建模与编程过程中,使用的数据只是现实数据的一种近似,因而得出的结果可能与现实情况有一定的差距。 2、脑卒中的发病受多种因素综合作用的影响,包括不可抗力事件,这些自然灾害和社会重大事件均会对人民的身心乃至脑血管意外的发生产生影响。虽然样本较大,但是时间不够长,对揭示规律有其局限性,有待今后更进一步的观察研究。 3、数据不知地区等准确位置,无法得到更多较为精确的相关气象,节气等相关信息。 4、在前面的统计过程中都是在理想条件下进行的,实际上,还有人口迁移、经济景气变动、死亡率变动等因素对脑卒中的影响。模型还有诸多变量因素在内。考虑以上因素进行模型的建立。 三、 模型改进及推广7.1 问题二的多元统计分析模型改进本文仅仅做了多元线性回归,但从以上分析过程可以看出,发病率与气象环境因素的线性相关性并不特别明显,需要对数据进行合理统计,找出发病率与环境因素的关系,该模型具有一定的局限性。模型改进可以从以下几个方面改进: 1、查阅资料考虑多元非线性回归方法; 2、气象环境指标的进一步细化统计,如考虑温度与湿度比、最高温度与最低湿度一起统计等; 3、针对多变量的选择问题,可以考虑主成分分析法、因子分析、典型相关分析等方法[1]。 7.2 推广及应用本文中的多元统计分析模型可以推广到任一有关某变量与其它多因素的相关关系,如冠心病、心脏病等疾病受环境、气象因素的影响分析,更加贴近生活,为我们的日常生活服务。 参考文献[1] 于秀林,任雪松,多元统计分析,北京:中国统计出版社,1999 [2] 杜强,贾丽艳,SPSS统计分析从入门到精通,北京:人民邮电出版社,2011 [3] 岳海燕,气象条件对南京地区慢性支气管炎和脑卒中发病的影响研究,硕士学位论文,南京信息工程大学,2009 [4] 彭扬君脑卒中发作的诱因分析,现代保健·医学创新研究,2008(8) [5] 李芸,郑虹,陈红信息支持对老年高血压病人生活方式的影响,现代护理,2004(6) [6] 现代中西医结合杂志2002年第11卷第6期3月号 [7] 刘春岭,黄如训,朱良付,曾进胜,苏镇培卒中患者高血压危险因素及并发症3059例20年回顾性分析,中国脑血管病杂志,2005(3) [8] 荆淑敏,魏淑芳,史丽珍,对心血管疾病病人开展健康教育的必要性,]山西护理杂志,1999,13(3):105-1576 [9] 饶明俐,中国脑血管病防中国脑血管病防治指南编写委员会治指南,北京:卫生部疾病控制司, 中华医学会神经病学分会, 2005 [10] 耿贯一,流行病学第三卷,北京:人民卫生出版社,1996 [11] 赵文慧,脑卒中病人的自我护理,http://www.365heart.com/tabloid/2010/06/temp_38155.shtml 2010-6-18 [12] 国际糖尿病联盟发布糖尿病预防新宣,2007,5-19 [13] 文章来源:放心医苑,http://www.fx120.net/disease1/200810/79219.html [14] 郭建民,张淑娥,初发脑中风的危险因子及预防,现代中西医结合杂志,11卷6期:524,2002
6 Y9 ]/ ^' W1 u! {! C/ S! C: A+ E. h! y( k/ @8 u/ h5 ^
|