第1章绪论
统计对我们每个人来说并不陌生,报纸杂志、电视广播、网络媒体等每时每刻都传递着很多统计数据和信息,我们也常听到很多关于“统计”方面的结果。例如,据统计,某年国民生产总值增长率为5.2%;某地人均寿命为80.3岁;2月份房屋销售量环比下降8.7%。还有许多问题需要应用统计学知识才能给出正确答案,例如,治疗艾滋病的新药有效吗?明年中国股市涨跌走势如何?新冠感染者的病死率如何计算?子女像父母的程度有多大?目前居民对医疗改革政策的满意度有多高?这些实际问题都会用到统计学。可以说统计学知识和思维已经渗透到自然科学、社会科学及人类生活的各个领域。在现代社会中,大到国家重大政策的制定,小到人们的日常生活,几乎都离不开统计学。
1.1医学统计学概述
1.1.1定义
1.统计学的定义 在西方,统计学(statistics)—词源于“state”(国家、情况),专指有关“国情”的学问,*初多用于文字记叙,后发展为数量比较,随着概率论思想和方法的引入,逐渐形成今天在理论与应用方面都己相当完备的独立学科。我国教育部1998年在《普通高等学校本科专业目录》中将统计学列为理学类一级学科。按照《教育部关于进行普通高等学校本科专业目录修订工作的通知》(教高〔2010〕11号)要求,2012年9月正式出台的《普通高等学校本科专业目录(2012年)》,将统计学(编号0712)列为理学类一级学科。
那么,什么是统计?广义上是人们通常所遇见的任何以数字、表格与图形所表达的一个事实,狭义上是将统计作为一门学科。什么是统计学?统计学有其自身独有的知识体系和方法论。国际上,著名的韦氏辞典中,定义统计学是,统计学是“a science dealing with the collection,analysis,interpretation,and presentation of masses of numerical data”,即统计学是一门关于数据的科学,具体而言,它包括收集、分析、解释和表达数据的科学。
1.医学统计学的定义 统计学与各个专业结合就形成了数十个学科分支,如社会统计学、经济统计学、人口统计学、心理统计学、遗传统计学等。统计学理论是随着人类社会生产需要而产生,同时也随着人类社会生产的发展而更新的。特别是近20年来,统计学的理论方法和应用得到迅速发展,新的领域与统计学结合形成的新的分支如同雨后春笋般不断出现。如果把统计学应用在医学领域,所形成的一个交叉学科,即医学统计学。因此,医学统计学有不同的定义,可以表述为:用统计学的原理和方法来研究医学领域中不确定性现象规律性的一门学科;或者表述为:是研究医学领域统计设计、数据收集、数据整理与分析推断的一门学科。这门学科是现在及未来非常活跃的,并且*具生命力的学科之一。
3.医学统计学应用现况 生物医学实验、临床试验、流行病学调查和公共卫生管理等领域都需要和统计学家合作;有的医学科研基金申请要求有统计学家参与合作,申请书必须包含详尽的统计设计与分析;新药开发和报批必须依法执行统计学准则,递交统计分析报告;公共卫生项目的确立和验收,必须基于抽样调查的数据和完善的评价体系;医学期刊发布统计学指南,邀请统计学家审稿,严控论文的统计学缺陷。总之,统计学思维和方法学己经渗透到医学研究和卫生决策之中。
但是,很多一线医学科研工作者对统计学重视不够,突出表现为忽视医学科研设计,在统计分析时盲目套用统计分析方法,对统计分析结果解释时轻描淡写、一笔带过。把统计学当成无关紧要的“修饰物”,严重影响了医学科研工作的科学性与严谨性。由于轻视或误用统计学而得出错误结论的例子并不鲜见。2002年11月9日,《科学时报》登载了军事医学科学院情报研究所胡良平教授公布的一个令人触目惊心的数据结果:全国各类医学期刊中,有统计学错误的论著竟占到80%。2001年,西班牙赫罗纳大学的Emili Garcla-Berthou和CarlesAlcaraz查阅了Nature上发表的181篇论文,发现38%的文章至少有一处统计学错误。2005年,Nature Medicine发表过一篇社论,题目为“Statistically Significant”,一开头就指出Nature和Nature Medicine因为登载的某些文章统计分析欠佳而遭到公众批评。
1.1.2怎样学好医学统计学
许多学生习惯于传统的医学统计学教学模式,往往是“填鸭灌输式”或“知识继承型”的教学方法,教师在上面讲,学生在下面听,忙于记笔记,死记硬背应付考试,以后科研中遇到统计学问题还是束手无策或误用滥用。因此,在如何学好医学统计学上我们提出如下建议。
1.培养科学的态度 在医学科研中,应用统计学的目的是要探究客观事物的规律性,提出检验或验证科学问题。当应用统计学处理实际资料得不到理想的结果(或阳性结果)时,有的人就拼凑数据甚至修改数据,这严重违背统计学的主旨,也是严重的学术造假行为。我们要遵从客观事实,认真分析原因。例如,各种因素是否考虑全面了?研究对象的选取是否合理?样本量是否足够大?指标选取是否适宜?收集资料的方法是否可靠?统计方法应用是否有误?统计计算是否正确?如果各个环节都没有问题,也许是我们*开始从专业上提出的科学问题就应该是这样的结论。学习医学统计学,就是要培养严谨、科学的态度。
2.强化“三基”的学习 “三基”即基本概念、基本原理、基本方法。在学习过程中,对复杂公式本身及其推导过程不做硬性要求,学生只需要了解其作用,而不必死记硬背其具体的形式,也不必深究其数学原理。医学科学研究所应用的统计学知识中约70%是*基本概念和经典的统计分析方法,其余则是较为复杂的、近代发展起来的统计理论和技术,而出现错误*多的却偏偏是前一部分。
3.重视统计方法的应用,把实际问题转化为统计问题 学习时一定要结合实例,*好从问题的原型入手,将其转化成统计问题,这是正确使用统计学的关键一步。根据设计类型、资料性质和分析目的,选择合适的统计分析方法进行资料处理。要经过从理论到实践、再从实践到理论的反复过程,循序渐进,才能逐渐掌握统计学,进而运用统计学解决实际问题时,才能得心应手。能否把各种实际问题转化为统计问题,能否合理选用统计学方法、正确运用统计学的理论和方法解决实际问题,是学好医学统计学的难点所在,也是衡量医学统计学教学质量的“金标准”。
4.掌握统计软件的操作 目前可以用来进行数据分析的统计软件很多,如SAS、SPSS、Stata、R语言等。在解决实际问题时,要重视各种检验方法适用的前提条件及应用场合,可以忽略其具体的计算推导过程;要熟练地掌握一种统计软件(如*简单、直观的操作软件SPSS),学会正确使用统计软件和正确选择统计方法,对软件输出结果及统计学结果作出正确解释。随着现代统计学和计算机技术的迅猛发展,一些新的统计学方法和技术逐渐成熟并得到广泛应用,统计软件的功能也日益强大,并促使医学研究向更深和更广的方向发展。
1.2医学统计工作的基本步骤
医学统计学贯穿于医学研究的始终,其思想与方法己广泛渗透到医学科研的各个环节,即在统计设计思想指导下,开展资料的收集、整理和分析。与此相适应,医学统计工作的基本步骤包括统计设计、收集资料、整理资料和分析资料。
1.2.1统计设计
研究设计(design)是根据研究的目的,从统计学角度提前做出周密的计划和安排,包括专业设计与统计设计。其中,专业设计是从专业角度考虑实验的科学安排,是科学研究的基础,包括选题、建立假说、确定研究对象和技术方法等;而统计设计则是根据研究的问题与目的,从统计学的角度对研究各环节作出的通盘考虑,以用尽可能少的人力、物力和时间获得准确可靠的结论,是科学研究工作的纲领和完成研究工作的关键环节。
根据研究者是否主动安排处理因素,对研究对象施加干预,医学研究一般可分为实验性研究与观察性研究。因而,统计设计包括实验性研究设计与观察性研究设计。对于实验性研究,统计设计重点在于明确研究涉及的基本要素(实验因素、实验对象和实验效应)与研究遵循的基本原则(随机、对照、重复),具体内容详见第18章;对于观察性研究,统计设计中所考虑的基本要素和遵循的基本原则,具体内容详见第17章。
1.2.2收集资料
收集资料(data collection)是获得研究所需原始数据的过程,要根据研究目的与设计确定。实验性研究收集资料主要是通过专项实验,如动物实验、临床观察实验;调查性研究收集资料主要是通过专题调查。无论何种途径收集到的资料,都应强调它的准确性、完整性。医学科学研究原始资料的来源如下。
1.报表资料 医疗卫生领域里的各种报表,如传染病报表、疾病监测报表、医院年度统计报表、卫生统计年鉴等。例如,研究中国传染病的疾病负担,要收集几年内中国疾病预防控制中心或国家卫生健康委员会传染病的报告数据;对10年后中国卫生技术人员中医生和护士人数进行预测,要对近20年的中国卫生统计年鉴丨中国卫生健康统计年鉴里中国卫生技术人员中医生和护士人数进行收集,建立数据集进行预测。
2.医疗、预防机构的日常工作记录 如住院病历、经常性工作记录和数据库等。疾病治疗质量评价的研究中,确定了评价指标后,要对医院住院患者的病历数据进行收集,利用统计分析方法进行影响因素调整和治疗质量评价。
3.专题研究的实验数据和调查资料 如补钙对280名绝经期妇女骨密度影响的数据收集有两部分:一是通过调查表调查绝经期妇女的一般情况、饮食情况、体育锻炼情况、生育史、心理健康与应对等资料;二是实验研究数据,实验分4组,每组70人,信息干预组只透露本人检查结果,不给干预措施,其余三组分别给A、B、C三种含不同剂量钙的奶粉,补钙1年及2年后分别测其骨密度值、血液与尿液中的实验室检测指标值。
1.2.3整理资料
整理资料(data sorting)是指对收集到的原始资料进行归类整理汇总的过程,即有目的地对收集到的原始资料进行科学加工,使资料系统化、条理化,以便进行统计分析。整理资料包括三方面的内容。
1.数据清理(data cleaning)对数据进行去伪存真的过程,即对原始数据进行检查、核对、纠错和改正。
2.逻辑检查(logical check)通过计算机对数据进行检查与核对的过程。根据逻辑关系、常识和专业背景知识,对所研究的资料进行检查与核对。对产生怀疑的数据,要进行深入核查并予以纠正。
3.统计核查(statistical check)为了进行统计分析,需要对原始数据进行加工,将其转化为频数分布表(frequency distribution)数据,可以根据数据间的关联性和频数分布图或表等进行核查。
整理资料主要步骤是审核资料、拟整理表和归纳汇总。在补钙对绝经期妇女骨密度的影响研究中,根据补钙前和补钙1年及2年后的一般情况、饮食情况、体育锻炼情况、骨密度值及实验室检测指标等,建立EpiData数据库,采用双向比对的形式对数据进行录入、检查与核对。将数据导入SPSS分析软件内,再进一步对数据进行逻辑检查。对数据进行粗加工、拟整理表、计算中间指标[如体重指数(body mass indes,BMI)]、进行归纳汇总等。
1.2.4分析资料
分析资料(data analysis)就是对整理的资料进行统计分析,获取资料中有关信息的过程,包括统计描述(statistical description)和统计推断(statistical inference)两个方面。统计描述是通过计算有关的统计
指标,对资料进行全面概括的描述,即统计指标的计算和统计图表的绘制。统计推断是从样本中的信息推断总体特征,包括两部分:一是参数估计(estimationofparameter),用样本统计量估计
展开