第1章绪论
医学影像始于1895年德国物理学家威廉 拉德 伦琴发现X射线,1978年,G.N.Hounsfield公布计算机断层成像(ComputedTomography,CT)技术,其被认为是20世纪科学技术的重大成就之一。自此,医学影像迅速发展,新的医学影像设备和医学成像技术不断涌现,医学影像在疾病诊断和治疗中也发挥了越来越大的作用。另一方面,近年来人工智能的迅猛发展,在人脸识别、目标检测等领域中展现出巨大的应用前景,而海量医学大数据的积累为人工智能应用于医学影像数据分析提供了良好契机,在此背景下影像组学应运而生,影像组学以人工智能为工具,通过对海量医学影像进行数据挖掘分析获得疾病图像的潜在病理生理信息,从而可实现疾病分期分型预测、疗效评估、预后预测等。本章内容以肿瘤为例,从医学影像的背景以及影像组学的概念、价值、方法流程和临床应用前景五个方面展开。
1.1医学影像的背景
根据世界卫生组织下属的国际癌症研究机构(The International Agency for Research on Cancer)于2018年9月发表的2018全球癌症报告,全球新增癌症病例高达1810万,因癌症死亡人数达960万,且年轻患者的发病率在逐年增高[1];中国国家癌症中心2019年1月发布的全国癌症统计数据报告表明,2015年全国恶性肿瘤发病约392.9万人,死亡约233.8万人;癌症已然成为严重影响人类生活质量、威胁人类生命的主要疾病。而癌症的早期诊断和准确的预后评估对于制定准确的个性化治疗方案起着十分重要的作用。
随着CT、核磁共振成像(MagneticResonanceImaging,MRI)、正电子发射断层成像(PositronEmissionTomography,PET)、超声(Ultrasound)等医学影像技术广泛应用于临床,为辅助肿瘤分期和评估肿瘤患者预后提供了影像学参考依据。医学影像是临床上对肿瘤进行临床评估以及治疗后疗效评估的重要工具。CT对肿瘤的诊断价值在于可以从CT图像中观察癌变组织的形态和密度改变、肿瘤的侵犯范围,对病变的分期判断具有重要的作用,但是对形态学不明显的早期病变难以做出诊断;MRI可多参数、多序列、多方位成像,在软组织对比度方面具有较高优势,可以清晰地显示肿瘤的大小、位置及其侵犯周围组织的程度,对肿瘤的诊断和分期有较好的临床价值,以帮助制订手术方案;PET对疾病诊断的灵敏度高,但分辨率低,现通常将PET和CT/MR组合以弥补PET分辨率低的问题,从而实现解剖定位。超声成像可以清晰显示脏器及周围器官的各种断面像,接近解剖真实结构,因其价廉、简便、迅速、无创、无辐射性、准确、可连续动态及重复扫描等优势应用甚广,常作为实质脏器及含液器官的首选成像方法。
医学影像作为一种无创的肿瘤诊断方法,已被广泛应用于各类肿瘤的辅助诊断中,但仍存在诸多挑战:
首先,目前使用影像信息进行临床辅助诊断往往依靠医生的主观经验,通过影像反映出的病人疾病影像特征给予相应诊断,然而医学影像中仍有待开发的揭示病变分期和预后的有价值信息。例如基于标准的医学图像,临床医生只能从中获得类似于肿瘤形状大小和肿瘤代谢等视觉信息,而这些信息可能和肿瘤的病理生理或者诊疗效果相关性不高,从而无法提供有效的手段早期量化肿瘤的病理分期分型或者肿瘤接受治疗后的变化[2]。而医学影像不仅仅是图像,除了提供视觉信息之外,还包含和肿瘤病理生理及组织细胞微环境有关的大量潜在信息[3],长久以来临床上并未对这些潜在信息进行有效利用,对医学影像数据的深度挖掘将能获得更多包括肿瘤形态学、潜在病理机制、肿瘤异质性等在内的信息,基于这些信息将有助于实现肿瘤的精准诊断、制定个性化治疗方案。
其次,医学影像已从*初单一的X射线成像发展为现在多种模态的医学成像技术,可以在病理、细胞和分子层次反映肿瘤信息。医学影像已成为临床上对肿瘤评估的有效手段,用于进行肿瘤分期分型诊断或者评估治疗效果5]。在肿瘤的标准化临床诊断和治疗中,对医学影像的应用大多数都只停留在对肿瘤解剖结构或者肿瘤大小的评估上,而且影像手段一般也被认为是一种较为简单的方法,这种偏见从一定程度上限制了医学影像在肿瘤异质性研究方面的应用潜力。医学影像为肿瘤异质性研究提供了一个潜在的数据来源。众所周知,肿瘤在不同的病人之间有着迥然不同的表型差异,而这种表型差异可以通过医学影像进行挖掘。医学影像的优势在于可以通过无创的方法获得肿瘤的外观表型,比如在宏观尺度的瘤内异质性,即肿瘤在生长过程中,经过多次分裂增殖,其子细胞呈现出分子生物学或基因方面的改变,从而使肿瘤的生长速度、侵袭能力、对药物的敏感性、预后等各方面产生差异。在目前的临床研究中,通过穿刺的方法也可以获取肿瘤相关信息,但是由于穿刺只能提取部分组织,而肿瘤异质性导致部分组织的检查无法全面地反映肿瘤内部病理信息。更进一步地,重复有创的穿刺操作对病人来说也是较重的负担。相反地,医学影像提供的肿瘤的影像表型则提供了包含肿瘤基因型、肿瘤微环境和潜在治疗效果的丰富信息。尽管肿瘤影像无法详细地量化肿瘤的生理过程,但是影像提供的信息可以对基因信息起到互补的作用。因此基于医学影像的肿瘤影像表型在精准医疗中的作用需要进一步地深入研究,肿瘤影像表型在临床上可以较为容易地获得,将对临床诊断、肿瘤分期和诊疗方案制定提供潜在帮助。而且,临床医师可以在每次随访都对病人的肿瘤影像表型进行量化评估,而病人不必为此增加额外的负担。
在目前的临床实践中,影像科医生采用一些简单量化指标去进行肿瘤评估,在CT的断层图像中,肿瘤大小可以通过二维或者三维方法进行描述;而在PET影像中,则只是采用*大或者平均造影剂摄入量去量化代谢。尽管这些指标都是很有意义的生物标志物,但是能够提供的信息有限。除了量化的影像学特征之外,从医学图像中还可以获取语义型特征,语义型特征指通过影像专家对医学影像进行肉眼评估获得的肿瘤特性特征。在临床上,语义型特征是对肿瘤的定性判断,在获取语义特征时,需要评估者具备专业医学影像背景知识,同时评估结论容易受不同的评估者的主观因素影响。因此临床医师也需要做大量的工作来定义术语以统一标准。建立统一术语标准的好处在于,术语由经验丰富的影像学专家定义,可以为肿瘤定性地建立一个统一的衡量标准。
1.2影像组学的概念
近年来,由于存储技术和信息处理技术的发展,病人的医学影像信息得到了很好的数字化保存,因此医学图像不再是少量的数据资源,而成为与互联网数据、金融数据并列的第三大数据资源。与以往的基于小样本的单纯图像处理相比,大量的医学图像带来了新的研究机遇:①基于大量的影像数据,可以建立更为精准的统计模型来提高计算机辅助诊断系统的诊断和检测水平,使其精度提高到接近人的诊断;②有了大数据的铺垫,很多更为复杂而且表达能力很强的机器学习、模式识别以及统计学方法可以发挥更好的作用,从而在海量的影像数据中挖掘出更多潜在的规律和信息。医学影像大数据的积累和人工智能技术的快速发展直接促使一项新的综合分析方法的诞生。
影像组学(Radwmics)是2012年由Lambm等人[6]提出的一种新兴的医学图像分析方法,指的是高通量地从影像中提取大量影像特征(因此*初译为放射组学),同年Kumar等人做了补充,将影像组学的定义扩充为高通量地从CT、PET和MRI中提取并分析大量高级的定量影像特征[7],扩充了成像模态,加入了定量分析等概念,Aerts等人在2014年Nature Commutations上发表了突破性的应用成果,指出影像组学的预后预测能力,进而引起了科研界的广泛关注[8]。通俗地来讲,影像组学是指从临床不同模态的影像数据中提取并分析具有强代表性的定量影像特征,即使用大量自动化的特征描述算法,将图像数据转换到高维可挖掘的特征空间,通过将其与临床信息进行对比分析,完成对病例数据的病变诊断和预测等工作。进一步来说,影像组学分析就是基于图像中提取的定量特征参数与肿瘤的分子表型及基因型存在一定的相关性这一假设,通过对临床诊断治疗中采集的医学图像进行后处理,提取肉眼难以看到的信息,并与其他基因组数据、代谢数据和蛋白质数据等结合,一起提高肿瘤的疗效预测及预后评估效能,*大程度上实现患者的个性化治疗。
1.3影像组学的价值
不同类型的肿瘤由于其病理特性不同,在影像上的表现迥异,不同的肿瘤影像特征也预示肿瘤对于治疗的反应不同,并直接影响着预后。目前通过影像手段实现肿瘤的预判都需要医生根据其主观的临床经验、病理切片以及血检等进行详细的检测得到临床检测结果。然而,基于现有的医学影像特征分析研究,某些多维纹理特征能够准确反映病变组织的病理学信息,对于实现个体化医疗具有重要的研究价值,所以一个完备的特征库对于后续关键特征筛选能够提供更全面的数据支持。因此采用计算机方法辅助完成病变的预测分析并给出可信的建议具有很好的实用意义[9]。
影像组学分析主要从图像中提取出与诊断相关联的特征并对其进行量化,例如在肿瘤的CT图像中,不同病理级别的肿瘤的形状、大小和纹理等方面存在差异。这些特征经常被医生作为人工诊断的依据,但其判断结果存在主观性且与医生经验有关,难以保证客观性和可复现性。在影像组学的分析流程中,这些医生定性描述的特征可以从图像的角度用数学表达式进行定量描述,从而提供客观可重复的诊断。影像组学试图通过大量的医学图像提取出和诊断结果有关联的图像特征,并由图像直接进行诊断结果分析,而不仅仅是单独的图像处理工作。例如,研究人员通过影像组学的方法提取出高维的图像特征,并发现这些特征和肺癌预后生存期高度相关。根据这些特征的取值不同,可以将病人分为不同的风险组,从而可以采用不同的治疗方案[8]。
除了使用图像数据外,影像组学还引入了基因分析的方法以提高诊断精度。在传统的基因分析方法中,通常在肿瘤的某个位置采样然后进行基因测序来判断某个基因是否突变。由于肿瘤的异质性,基因突变可能在没有被取样到的肿瘤的其他部分发生。因此,传统的基因分析可能有抽样误差。一旦出现基因突变,这些基因会对肿瘤的生长产生影响,从而可以表现在影像数据中[10]。影像组学特征可以从整体肿瘤图像提取,进而包含更完整的信息。影像组学中基因分析的特点可以和传统基因分析互补提高诊断精度[11]。
影像组学可以使用多种模态的影像数据,影像组学对常见模态都可以进行分析。影像组学分析不仅局限在肿瘤学领域,包括2020年初在全球范围内蔓延的新型冠状病毒肺炎,影像组学也能够在其早期诊断、预后预测、疗效评估中产生一定的价值。
1.4影像组学分析方法概述
影像组学的核心步骤是提取高维影像学特征。在获取影像数据后,可以使用自动算法进行病灶区域检测,针对检测到的病灶区域使用手动或自动分割以得到精准的肿瘤区域图像。针对提取出的肿瘤区域可以使用图像处理的方式提取出高维特征,*后,使用机器学习或统计学的方法对特征和病理结果进行关联性分析从而通过影像数据预测病理结果。
影像组学分析主要包含以下五个步骤[12]:
(1)图像获取及重建。由于不同扫描仪的重建方法和层厚不同,日常临床获取的图像的参数(如分辨率等)也会有较大差异,而这会给不同研究中心和不同病人群体之间的比较带来很大困难。为了减少这种差异,一方面可以通过制定一系列临床医学图像采集规范,尽可能地减少参数的差异,另一方面可以在分析过程中尽量选取不同患者之间高重复性、有足够动态范围并且对图像获取协议和重建算法不敏感的特征[13]。
(2)图像分割。影像组学分析提取的特征是针对肿瘤,正常组织及其他解剖结构等感兴趣区域(volumes of interest,VOI)的,因此VOI的准确勾画对接下来的特征量化、特征提取和统计分析起着非常重要的作用。通常将有经验专家的手工分割结果作为金标准,但是这种方法非常耗时,而且具有非常大的主观性,并不适合基于大数据量医学
展开