肺癌是常见的恶性肿瘤之一,根据GLOBOCAN 2020数据,肺癌的发病率为11.4%,死亡率为18.0%[1],原发性肺癌中,80%~85%为非小细胞肺癌(non-small cell lung cancer,NSCLC),晚期NSCLC患者的生存率(overall survival,OS)较低[2-3]。治疗过度或不足均会对NSCLC的总体疗效产生显著影响[4]。因此,精准治疗有望为NSCLC的治疗提供新的方向。
早期NSCLC仍以手术切除或立体定向放疗(stereotactic body radiation therapy,SBRT)为基本治疗手段,但围绕着手术及SBRT后如何实施精准辅助治疗,目前仍有很多亟待解决的问题,主要涉及到早期NSCLC如何依据肿瘤生物学特性确定治疗策略、技术的选择以及实施精准辅助治疗。影像学、病理学、体液检查等均是现今肿瘤信息获取的来源。由于肿瘤在时间和空间上的异质性,侵入性活检难以反映肿瘤的全貌,而体液检测则在灵敏度和特异度方面均没有稳定的表现,且无法完成定位诊断,医学影像学特别是胸部CT仍是方便、经济、能反映肿瘤定量、异质性和空间分布的信息来源之一。
由于早期NSCLC的治疗决策、方法和技术选择有赖于淋巴道和血道转移的准确判断,本综述将介绍基于胸部CT识别早期NSCLC淋巴道和血道转移风险的研究进展并展望未来。
1
基于胸部CT预测早期NSCLC淋巴道或血道转移风险研究的临床意义
手术和SBRT是早期NSCLC重要的局部治疗手段,围绕着初始及辅助治疗,个体化精准治疗水平仍有待提高。其主要面临两大临床问题:一是早期NSCLC如何进行治疗前的精准临床分期,从而指导治疗方法的选择以及手术范围的确定。当前肺癌分期仍基于TNM分期,其中N即淋巴结是肺癌最常见的转移靶点,因此淋巴结转移(lymph node metastasis,LNM)对肿瘤分期、治疗计划选择和预后预测非常重要[5]。在治疗方法的决定上,由于SBRT不进行预防性淋巴引流区照射,如果被判定存在较大LNM风险则往往推荐手术切除。在手术范围的确定方面,早期NSCLC首选肺叶切除联合系统性淋巴结清扫术[6],但这也导致了许多无效的淋巴结清扫,因为许多早期肺癌实际上没有LNM,亚肺叶切除和选择性淋巴结切除可能更适合临床T1期周围型肺腺癌[7];然而,约10%的临床Ⅰ期肺癌患者却最终通过手术被确定为阳性LNM[8]。因此预测淋巴结的恶性受累对于确定最佳治愈性治疗策略至关重要。
目前,影像学是评估肺癌患者纵隔淋巴结是否受累最常用的方式。然而,CT扫描诊断纵隔LNM的灵敏度和特异度仅为55%和81%[9]。正电子发射计算机体层成像(positron emission tomography and computed tomography,PET/CT) 中最大标准化摄取值(SUVmax)>2.5是目前接受的NSCLC阈值[10],但因为纵隔中的基础FDG(fludeoxyglucose)摄取较高,从而导致评估LNM的阳性预测值较低[11]。据此,一些指南推荐使用经支气管针吸活检或纵隔镜活检进行侵入性纵隔分期[9,12]。然而,并非所有可疑病灶都能进行有创性检查,对于侵入性纵隔分期的适应证尚未达成共识。
因此,我们可能需要依赖基于医学图像的新兴图像分析及处理技术,进行LNM的非侵入性预测,从而指导更精准的治疗决策。
早期NSCLC预后和失败表型的可视化,将进一步细分局部治疗后不同预后人群,从而进行精准的个体化治疗。在各种治疗失败表型中,血道转移导致了高达90%的人类癌症相关死亡[13],Ⅰ期NSCLC术后远处转移率为20%~30%,是影响5年OS的最显著因素[14]。在放疗领域,尽管SBRT的局部控制率达85%~95%[15],但远处转移仍然很常见,3年和5年远处复发率分别为22%和31%[16]。若能早期识别血道转移高危人群并对其进行辅助化疗干预,可能为患者带来生存获益。可见,如何预测发生血道转移的风险,从而使得局部治疗后辅助化疗精准实施是一个重要的临床问题。
然而根据传统的TNM分期尚无法精准预测患者的预后[17],经深度挖掘的影像特征可以成为一种新的预后因素,通过无创性量化肿瘤异质性预测肿瘤发生血道转移的可能性,以允许对患者进行预后风险分层并制定更精细的治疗策略。
综上,早期NSCLC个体化精准治疗水平仍较低的主要原因在于目前的TNM分期仍不够准确,且准确分期及精准预测预后仍存在技术问题。因此,临床上急需发展能够进行精准临床分期以及预测早期NSCLC生物学特性的新兴技术以提高精准治疗水平及总体疗效,医学影像分析可能是重要的研究方向。
2
基于胸部CT识别肿瘤生物学特性的方法学进展
2.1 基于胸部CT主观定性分析
最初对于医学影像的分析多来源于放射科医师的主观判断,分别从胸部CT图像中占位性病变的大小、外形、分叶、毛刺、空泡、造影剂是否增强等方面进行描述,但这些定性指标往往存在着不确定性,受主观判断影响较大,且缺乏量化信息。
2.2 基于胸部CT特征定量分析
随着时间和经验的积累,研究者确定了一些定性视觉物理特征,并以高级统计方法构建模型以量化描述肿瘤特征[18],例如有团队基于CT中分叶征、胸膜凹陷、瘤周血管、最大径、CT值等图像特征通过随机森林算法,在磨玻璃结节分类方面可达99.1%的灵敏度和95.1%的准确率[19],判别效能显著提升,弥补了主观判断法中量化信息不足的缺陷,但其仍离不开医师对于病灶的解读,受到许多不稳定因素的影响。
2.3 基于影像组学定量分析
为了更深入地分析医学图像,Lambin等[20]提出了“影像组学”这一概念,其主要理论是肿瘤的病理生理相关信息驻留在医学图像中[20- 22],并且能够被通过高通量计算从医学图像中提取大量高级定量特征的影像组学所描述。影像组学可以通过高级统计方法定量分析或进一步与人工智能如机器学习相结合,形成预测和预后模型,对肿瘤生物学特征进行可视化分析,捕获易被肉眼忽略或无法识别的高价值癌症信息[23],从而挖掘临床医疗决策及个性化治疗的潜力[24]。其基本流程包括图像获取、肿瘤分割、特征提取和包含特征筛选、建模及性能测试的数据挖掘分析共4个阶段。
2.4 基于深度学习
然而,影像组学往往需要人工预先定义一系列在整个建模过程中保持不变的定量高维特征,限制了模型的表达能力及自动性。近年来兴起的深度学习模型,将特征提取和预测建模过程融合,借助图像标签进行端到端学习,指导特征不断更新进而提高模型预测效能。在医学影像领域,以卷积神经网络(Convolutional Neural Networks,CNN)的应用最为广泛,也最为重要[25]。CNN是多层前馈神经网络,通过模拟人脑视觉系统,接受图像作为输入,从数据中学习从而自动发现具有高度判别力的图像特征,完成检测和分类等任务[26]。其基本框架由输入层、提取特征的卷积层、筛选和过滤特征并将其合并成一的池化层、起到分类器作用的全连接层和输出层构成。此外,当训练样本有限时,也可将预先提取的影像组学特征作为输入,融合临床特征等信息,利用全连接神经网络,更好地建立特征与标签间的非线性关系, 提升模型识别效能。
综上,基于胸部CT识别肿瘤生物学特性在方法学上已取得了显著进展,影像组学定量分析和深度学习作为近年来发展的新技术,被认为是最有可能定量描述出肿瘤生物学特性的技术路径,值得临床关注和研究。
3
基于胸部CT的影像组学和深度学习预测早期NSCLC淋巴道及血道转移风险的研究进展
3.1 早期NSCLC淋巴道转移状态预测
3.1.1 识别早期NSCLC隐匿性LNM的风险
3.1.1.1 基于影像组学定量分析的研究
(1) 基于原发肿瘤的CT图像分析:Liu等[27]针对187例cN0外周型肺腺癌患者进行的回顾性研究发现结合219个原发肿瘤的定量3D影像组学特征和9个语义特征生成的逻辑回归模型可以有效地提供淋巴结受累信息。He等[28]建立并验证了一项基于原发肿瘤区影像组学的NSCLC患者术前LNM的预测风险评分,展现出良好的鉴别能力和校准,有助于对LNM包括CT提示阴性的隐匿性转移进行术前个体化预测及危险分层,从而为个体化治疗提供基础。对肺癌N2转移进行风险分层对于是否需要接受侵入性纵隔分期手术的临床决策至关重要,Yang等[29]通过半自动分割原发病灶后提取并筛选出5个基于CT的最佳影像组学特征构建标签,证实其预测临床Ⅰ期肺腺癌N2转移风险的性能较临床模型更佳。Zhong等[30]基于492例肺腺癌患者术前平扫CT原发肿瘤区提取300个影像组学特征构建模型,发现其预测隐匿性纵隔LNM的曲线下面积(area under the ROC curve,AUC)值可达0.972。这些相关研究都证实了影像组学相较于传统方法在预测LNM方面的出色表现。
(2) 基于原发肿瘤内及肿瘤周边的CT图像分析:由于肿瘤的浸润,原发肿瘤周围的肺组织可能也会受累,并且在一定程度上影响着肿瘤的转移。Wang等[31]从肿瘤内和肿瘤周围肺实质CT图像中各获得了1 946个影像组学特征构建标签, 结果发现两者均显示出良好的预测临床T1期周围型肺腺癌患者LNM的能力,而将其结合构建的模型AUC增加到0.843,影像组学列线图的AUC达0.869。Das等[32]的一项研究则进一步整合了从瘤内、瘤周和淋巴结CT影像中提取的特征构建影像组学标签,发现整合模型能够显著地提高预测cT1N0M0肺腺癌患者LNM的能力。这些研究都提示在构建模型时整合利用CT多区域图像的优势,为未来的研究提供了新思路。
(3) 基于影像组学及其他相关变量的多模态融合分析:仅基于影像得到的信息可能是有限的,当其与其他信息如临床基线参数、CT报告结果等融合时可发挥更全面可靠的预测性能。Yang等[33]从159例肺腺癌患者的静脉期CT图像中提取并筛选出14个影像组学特征,使用多变量逻辑回归模型结合CT报告的淋巴结状态构建列线图,用于cN0亚组的隐匿性LNM预测时被证实具有良好的辨别能力,AUC为0.875。Cong等[34]也开发了一种基于术前静脉期对比增强CT的影像组学模型以预测ⅠA期NSCLC患者的LNM,发现将影像组学特征与临床参数结合构建的组合模型预测性能显著优于单一模型,AUC达0.911。Li等[35]开发了一种基于非增强CT中原发肿瘤区域和邻近胸膜区域所提取的影像组学特征构建的模型以预测肺腺癌患者的LNM,并将其与CT形态特征和临床特征通过多变量分析结合构建组合模型,发现其分类N0~N3的性能颇佳,可以有效地识别隐匿性LNM及转移区域。可见影像组学特征与其他模态信息相融合时能显著地提升预测效能,可以说是该领域的一大突破。
3.1.1.2 基于深度学习的研究
随着深度学习近年来的兴起,在预测LNM方面也逐渐出现了一些新的研究。2020年Zhao等[36]将基于CT的影像特征和如肿瘤衰减、癌胚抗原、最大径、毛刺征、胸膜浸润、吸烟史等临床特征整合开发出一套跨模态3D神经网络,用于预测临床T1期肺腺癌隐匿性LNM,AUC值达0.926,显著优于逻辑回归模型、单一模态模型、影像组学模型以及放射科医师评估结果,展现了多模态融合深度学习模型良好的预测性能。Wang等[37]提出了一种具有尺寸相关阻尼块的新型深度预测方法,用于从肺癌原发肿瘤的CT图像中识别LNM,结果发现由40 keV能量级的CT图像数据集训练所得的模型预测的准确率达86%,并应用五倍交叉验证解释了较低的能量级CT结合肿瘤异质性和尺寸因素可以更有效地预测LNM。
综上可见,针对基于胸部CT,用于识别早期NSCLC隐匿性LNM风险的影像组学研究已到了一个较为成熟的状态和水平,其与其他模态的融合能够进一步帮助提升模型的预测性能。另外,深度学习这一新领域也为对于CT图像信息的进一步挖掘提供了新可能。
3.1.2 识别淋巴结良恶性
3.1.2.1 基于影像组学定量分析的研究
大多数当前的研究主要将感兴趣区(region of interest,ROI)定为原发病灶区,也有研究者将图像区域限定在淋巴结本身进行区分淋巴结良恶性的研究。Bayanati等[38]从肺癌患者的72个淋巴结平扫CT图像中提取影像组学特征及形态特征通过逻辑回归分析构建模型,证明其能以81%的灵敏度和80%的特异度识别恶性淋巴结,并能使84%的恶性淋巴结和71%的良性淋巴结得到正确的分类。Andersen等[39]在对比增强CT图像中勾画淋巴结ROI,并从中提取纹理特征进行分析,结果显示其在鉴别NSCLC患者可疑纵隔淋巴结的良恶性方面能够有所帮助,重复性较好,观察者内方差较低。Dong等[40]纳入了201个静脉期CT中显示为肿大的纵隔淋巴结并从中提取影像组学特征拟合模型,结果发现包含8个最佳特征的逻辑回归模型与纵隔淋巴结恶性状态显著相关,并且在区分良恶性方面具有令人满意的诊断性能,AUC为0.850,同时证实了影像组学评分在不同因素之间具有普遍性。
有研究[41]直接以纵隔淋巴结作为研究对象,但其创新之处在于分别从平扫期、静脉期和动脉期不同时间点的CT图像上提取影像组学特征建立模型以预测淋巴结的转移状态,结果发现根据平扫期CT构建的模型预测性能最佳。
这些研究都证明了直接利用淋巴结自身影像特征构建影像组学模型也能展现出较好的预测性能,为鉴别影像上表现为肿大淋巴结的良恶性提供了可能,从而进一步指导手术或放疗的具体方案。
3.1.2.2 基于深度学习的研究
Shin等[42]使用在90例患者的CT图像中标记出的388个淋巴结,在一种计算机辅助诊断系统上训练并评估采用三重交叉验证的CNN模型,证明其识别阳性与阴性淋巴结的AUC值最高可达0.95。但目前该研究领域在深度学习中的应用还相对比较少见,这可能也是未来值得研究的方向之一。
3.2 早期NSCLC术后及SBRT后血道转移风险预测
3.2.1 基于影像组学定量分析的研究
3.2.1.1 基于影像组学单一模态的CT图像分析
Yu 等[43]分析了147 例接受手术的Ⅰ期NSCLC患者的对比增强CT图像,并且设置了由295例接受SBRT患者构成的独立验证队列,使用随机生存森林方法由2个影像组学特征构建了一种最优模型,发现其对于血道转移具有显著的预测效能,风险比为1.04,证明影像组学模型可以对患者进行治疗前风险分层,从而有助于个性化定制治疗选择。Huynh等[44]的研究发现接受SBRT的早期NSCLC患者的总生存率与两个常规特征和两个影像组学特征有关,而影像组学特征Wavelet LLH统计范围对血道转移具有显著预测意义。该探索性分析表明,影像组学特征有可能预测SBRT患者常规影像学指标无法预测的某些结果。
3.2.1.2 基于影像组学及其他相关变量的多模态融合分析
PET/CT可以作为另一模态信息提供补充资料,与CT的融合可能为模型效能的提升带来帮助。Oikonomou等[45]回顾性检查了150例接受SBRT肺癌患者的42个CT和PET/CT衍生特征的主成分,发现不同主成分的组合模型对于远处控制均展现了良好的预测性能,在与SUVmax的联合分析中发现,由特定特征组成的影像组学模型对远处控制的预测性能独立于SUVmax。
以上研究为我们展示了基于胸部CT及其他信息的影像组学模型在预测早期NSCLC术后及SBRT后血道转移风险方面的潜力。
3.2.2 基于深度学习的研究
当前基于胸部CT图像的深度学习技术在预测早期NSCLC血道转移风险领域的应用并不普遍,而在其他相关方面则有了一些进展,例如在局部晚期NSCLC中,Xu等[46]分析了患者的时间序列CT图像,发现每次向CNN模型中加入额外(包括治疗前及治疗后1、3、6个月)的随访CT图像都会进一步增强模型对于血道转移的预测性能,对拓展早期NSCLC的临床应用场景有所启迪,成为探索方向之一。另外,Tau 等[47]则使用CNN分析NSCLC患者的分段PET/CT图像,发现其在预测血道转移方面的特异性较高,但敏感性较差,可见基于PET/CT的深度学习模型在预测NSCLC血道转移方面的结果并不令人满意,基于胸部CT开发相关模型是否可以达到更好的预测效能则更值得关注和探究。因此,以早期NSCLC胸部CT影像为基础开发深度学习模型用于血道转移风险预测可能是未来研究的方向。
4
问题与展望
虽然基于胸部CT的影像组学和深度学习在分析肺癌生物学特征、预后预测等领域获得了显著进步,但在临床运用前还需要进一步完善:①两者均亟待建立统一的技术标准。其所涉及的一系列复杂的仪器、参数、术语、算法、图像注释及硬软件等的规范不足以及应用场景的不同均会使算法的可推广性和模型的泛化性受到限制[48]。②两者均受限于数据共享不足及其伦理法律问题。目前研究对于多中心、高质量、大样本数据的需求尚难以充分满足,医学影像大数据库的创建还存在很大困难。③目前的研究大多建立在回顾性队列的基础上。为了得到更高的性能和更好的可重复性,前瞻性研究必不可少。④来自生物性因素的限制。呼吸运动不可避免地会影响CT图像的质量;肿瘤的异质性及并发症的复杂性使得对单一大块ROI的分析可能不足以满足临床决策的需求。
影像组学和深度学习在临床应用中受到的挑战虽不可避免,但其发展前景也不容小觑:①在成像手段方面,PET/CT与CT结合构建模型以及4D-CT的开发在完整地提供肿瘤丰富的生物学信息方面提供了可能;光谱CT在减少辐射剂量的同时在改进病变检测、组织特征描述和分解方面展现出巨大的潜力,而深度学习也为其使用滤波反投影等传统重建法产生的条纹伪影和噪声等不足提供了新的解决方案[49],如使用各种多尺度功能融合和多通道过滤增强方法如U-net、总变异、残余学习和同位素适应等[50],以及基于稀疏投影视图的双帧和紧帧U-Net[51]、多级波段CNN[52]等方式有效地提高光谱CT图像的重建精度。②在算法及建模技术手段方面,弱监督学习、迁移学习、小样本学习、自监督学习及增量学习等方法有机会缓解样本量的不足[53];集成学习将支持提取多级别语义图像标签以提高其跨不同图像类别的泛化能力[25]。③在创新性方面,Delta-影像组学从治疗前、中、后获得的图像集中提取量化特征以提供特征值演变的信息,从而改善预后预测[54];蛋白、基因、转录、代谢及剂量组学等研究的不断发展使跨模态模型成为未来研究的新领域及新可能;另外,热图技术可以在一定程度上提高模型的可解释性[55]。
5
总结
综上,虽然基于胸部CT的影像组学和深度学习的应用尚待完善,但其在早期NSCLC转移状态预测与评估方面已作出了巨大贡献。我们有理由期待,辅以新兴技术的开发,影像组学和深度学习的应用前景必然会更加广阔,临床上基于胸部CT影像识别肿瘤生物学特征的诉求也会得到进一步满足。
[参考文献]