第一章 循证医学与叙事医学:一对和谐的夫妇
得啦,你们这倔强而无能的可怜虫,
过去,我心志跟你们一样的高傲,
一样会使性子——也许更说得出理由,
一句顶一句,冷面孔对付冷面孔;
现在我才明白,我们手里的长矛只不过是稻草罢了,
我们的体力太弱小了,
这一身软弱,怎能跟男子汉比?
——《驯悍记》威廉 莎士比亚
在威廉 莎士比亚的名作《驯悍记》中,主人公皮特鲁乔(Petrucho)和卡塔琳娜(Catharina)之间充满激情与冲突的故事,也许是在如今循证医学所主导的时代下,对循证医学与叙事医学彼此关系的*恰当类比。故事中的两位恋人性格悬殊而依然故我,尽管困难重重,却*终实现和谐相处,结为夫妻。这一努力转化成一种正向能量,开始温煦周身的一切。随着故事情节的进展,我们可以感受到冲动而叛逆的卡塔琳娜和鲁莽的皮特鲁乔之间炙热的爱情。皮特鲁乔试图超越社会习俗和礼节,借扮演狂人角色来征服他渴求的对象,但从未对她残忍相待。同样,循证医学(evidence-based medicine,EBM)可以类比为婚姻中的社会责任(皮特鲁乔在故事开始时所体现的价值取向);叙事医学(卡塔琳娜)则以其怪异、突兀的思考和行为方式而具备了打破陈规的能力。在一段历经分歧、斗争与和解的故事之后,以这对主人公联姻结局,创造出一对“完美的伉俪”,他们的思维模式*终和谐统一,尽管初看之下两者迥隔霄壤。
循证医学:起源和现状
作为当今医学和临床研究的基石,循证医学由来已久。早在20世纪70年代,流行病学家David Sackett开创性地提出将标准化引入临床研究方法学的想法,并在这一创新的实践中首次阐述了循证医学的概念。借助调研,Sackett使当前临床研究中存在的诸多缺陷展露无遗,并进一步指明了降低临床研究偏倚的具体途径,即通过标准化的方式,规范随机临床试验的设计、实施和报告。不仅如此,Sackett还同样条理清晰地对健康状况和疾病展开分析,着眼于其诱因、诊断、预后、临床预测、预防、治疗和改善,以期在卫生服务质量和成本效益之间找到平衡。作为加拿大麦克马斯特大学(McMaster University)临床流行病学系的创始人,Sackett于20世纪70年代末积极倡导在医学和其他卫生保健学科的实践中使用临床流行病学原理;他深知,医学研究方法亟待转变,从当下家长式的、照章转诊式的风格,向更加科学、严谨的方向发展。这种伦理-科学式的研究方法(ethical-scienti?c approach)*初被称为医学文献的批判性评价(critical appraisal of the medical literature),旨在帮助医疗从业者紧跟卫生保健的科学前沿(Sackett and Haynes,1976)。根据Sackett于1996年所做的定义,循证医学逐渐发展为“审慎、明确和明智地利用现有*佳证据来进行针对患者的医疗决策”。
由于*终使研究的动力来源从医护人员的主观“见解”转化为更加可靠的系统化方式,学界对循证医学的认可度与日俱增,循证医学在短短几十年间成为科学和医学的主导范式,尤其成为科学院校医学、护理学和生物医学教育体系中基础性的主导哲学。在Sackett为循证医学做出定义的近20年后,循证医学在全球化趋势下传播至北美和欧洲,并被世界卫生组织(World Health Organization,WHO)视为临床科学发展的原动力。
尽管循证医学建立的初衷纯粹基于伦理学和科学的考量,但其在发展中仍不可避免地延伸至其他与之内在相关的领域,如卫生管理学、卫生经济学,甚至法学;事实上,依据循证医学的建议进行医疗决策已经成为良好临床实践的基准,并陆续演变为面向执业医师、医疗管理者和医疗保险从业者的辅助决策工具(Evidence-Based Medicine Working Group,1992),*终在法庭上保护医生免于医疗事故索赔(Goldman and Shih,2011)。
因此,过去数十年间,循证医学提升了医学的层次,在帮助医学摆脱其既往所展现的家长式和超人/宗教式行为模式方面发挥了重要作用,且从历史的角度来看,它有助于抵消和平衡医生对患者的权威。
然而,在Sackett的定义中,“对个体患者群的护理(the care of individual patients)”这一表述也引出我们对患者作为个体这一首要问题的探讨。我们必须注意到,此处的“个体(individual)”代表单数概念,但患者群(patients)指复数实体。这一细微差别本身就是一个极为关键的问题。但多年来,这一问题始终被参与设计和进行临床试验的研究者忽视,这些研究者始终致力于解决仅针对人群和患者亚组的问题,在这些问题上,为满足更普适的研究结果和更广阔的应用前景,常常牺牲了患者的个体性差异。
当我们回顾Sackett对循证医学的定义时,“个体患者群(individual patients)”一词似乎预示着一个哲学悖论的诞生,并让我们开始怀疑,针对个体的解决方案如何适应整个人群。在Sackett介绍循证医学概念,并于加拿大麦克马斯特大学的临床流行病学和生物统计学系传播循证医学时,已经在其中暗含警示。尽管 Sackett仔细阐述了他的想法,尽管他希望在科学和临床判断之间寻求和解途径,但循证医学仍旧以无法遏制的速度向前发展,这一发展态势或许超出了他的预期,并*终将患者的个体性差异问题搁置于幕后的次要地带。
事实上,迄今为止,上述问题已经尤为突出,科学界内部开始涌现出一些声音,呼吁对无条件使用循证医学的行为做出批判性评价。在这些声音中,流行病学家、基础卫生保健专家、伦敦玛丽王后大学(Queen Mary University of London)基础保健和公共卫生中心(the Centre for Primary Care and Public Health)研究影响(Research Impact)的负责人Trisha Greenhalgh 指出(Greenhalgh,2014):
现在是时候制止医生过度使用证据、制止能说会道的行业销售人员用巧妙的营销策略操纵医生进行决策了。针对一般患者群体的研究所得出的结论不应比个体患者通过观察自身和疾病所获得的结论受到更多重视。患者的‘个人体验’极为特别,是主观的和难以被标准化的。捕捉和接纳患者‘个人体验’的全新过程,将有助于确保每位患者都能得到正确的治疗。
医学界必须发展‘共同决策的科学’,其中,流行病学证据负责回答对患者而言何者*重要,以及何为实现这一目标的*佳路径。在此过程中,我们可以超越循证医学目前的限制,开发出一套全面的方法来解释患者的疾病体验,并促进良好的临床实践。
2014 年,流行病学家和叙事医学学者Greenhalgh因其争议性文章《循证医学存在缺陷吗?》(Is Evidence Based Medicine Broken?)而引发不少关注,她在文中间接质疑了循证医学的效用和职能。她的思考起始于《英国医学杂志》 (British Medical Journal)面向英国内科医生开展的问卷调查,该调查相当直接地询问医生们是否认为循证医学存在缺陷,并只允许回答“是”或“否”。正反双方的回答比例大致均等:51%为肯定,49%为否定。调查者将循证医学的缺陷归结为几个方面,其中包括:在试验中只能选择金标准作为参照,而无法选择那些已经被医学实践证明有效,但尚未受到科学界认可的替代疗法(如瑜伽);包括学术团体和私有企业在内的各大利益相关方捏造出本不存在的“幽灵疾病”(如女性性唤起障碍);循证医学及其决策工具实际不足以应对和掌控错综复杂、不可预知的真实世界临床实践。
抛开数字不谈,这些发现似乎在某种程度上暗示了循证医学在民意支持上的疲软,以及暗藏在当前应用的科学方法论背后,其合理性和逻辑性中的不确定性。
除了上述调查中突显的因素之外,我们无疑还能在循证医学的缺陷清单中增加一条——将有合并症或年老的患者列入排除标准。早在循证医学创立之初,Evans于1995年发表的文章中就已经提及这一偏倚。他曾在文章中质疑,新千年的科学图腾究竟是基于证据的医学(Evidence-Based Medicine)还是偏倚证据的医学(Evidence-Biased Medicine)。
另一问题在于,依靠大样本量得出的试验结果仅能确定其具有统计学意义,这些结果以临床意义的角度衡量,可能并没有作为医学证据的价值。“某种疗法的效力越强,证实其效力所需要的样本规模就越小”(Howick,2015)。
发表偏倚是另一个陷阱。大多数已发表的试验呈现阳性结果,而专门报告阴性结果的见刊文章数量极少。尽管期刊编辑赞同并欢迎作者投稿呈阴性结果的试验,但似乎只有那些试验结果在赞助者看来颇为有利的文章才能得以发表(Turner et al.,2008)。例如,在关于抗抑郁治疗的研究中,美国食品药品监督管理局(FDA)核实已投稿的总计74项研究,有38项(占51%)报告阳性结果,而这38项中除1项外,其余全部发表在科学期刊上。其他36项研究(占49%)被FDA判定为阴性结果(24项)或结果尚未明确(12项)。在这36项研究中,仅有3项得以发表并报告了非阳性(non-positive)结果,而其余33项不是未能发表(22项),就是如Turner所预料的那样,*终以阳性结果发表(11项),并与FDA的判定冲突。总体而言,通过比较那些*终发表结果与FDA判定结果一致的研究,可以发现,得出阳性结果的研究*终见刊的可能性约为得出非阳性结果的研究的12倍(RR:11.7;95% CI:6.2~22.0;P<0.001)。在这里,尽管国际上有关的出版伦理学指南要求所有结果都要发表,不论是阳性的(好的)还是阴性的(差的),但统计结论仍然表明出版偏倚极有可能存在。
然而,如上所述,由于其作为决策工具的主导作用,循证医学不可避免地在医疗之外的领域产生强大影响,在制药、医疗保健、保险等诸多产业领域产生强大的经济驱动力。
《经济学人》(The Economist)杂志于2013年10月发表的《为何科学误入歧途?》(Why Science Goes Wrong?)一文对科学出版物的可靠性表示怀疑,并提出疑问:科学知识如何能以更恰当、更有效的方式实现和分享?文中(The Economist,2013)写道:
出版或出局(publish or perish)的规则已经开始统治学术活动。就业竞争是残酷的 名利之心也诱使研究者夸大和拣择研究结果。顶尖期刊为保障其独创性,强行加高拒稿率:超过90%的投稿被拒。*惊人的发现才*有可能登上刊物的页面。难怪有1/3的研究者会察觉身边有这样一位同事:他们在论文撰写过程中,会将那些“经直觉判断”即将干扰结果呈现阳性的研究数据删除。在过去,总会有人在无意中混淆真实的阳性结果与统计影响下的假阳性结果。而现在,随着世界各地越来越多的研究团队围绕同一假设展开研究,这种无心之失发生的可能性越来越小。刻意制造的阳性结果频频刊登在渴望内容轰动一时的期刊上。
统计学有时能掩盖真正的临床疗效。只有那些可能产生统计学差异的发现才会被拿去开展临床试验,在统计学检验问题上过于泾渭分明,只为求得一个有统计学差异的结果。
生物技术风险投资者的一条经验法则是,半数已发表的研究无法再现。甚至半数也只是乐观的估计。去年,Amgen生物技术公司的研究人员发现,在53项具有里程碑意义的癌症研究中,他们只能复制6项。在此之前,Bayer的研究团队也仅在同等重量级的67篇论文中成功再现了约1/4。一位顶尖的计算机科学家担心,其子领域中3/4的研究论文都没有意义。2000~2010年,部分研究由于失误或设计不当而被撤回,但基于这些研究已经开展的临床试验,其参与患
展开