本文系統(tǒng)闡述了人工智能技術在肺部腫瘤早期篩查、病理診斷、預后評估、手術導航和免疫治療等方面的研究進展,相信人工智能技術必將為肺癌的診治帶來新的機遇,并將有助于提高肺癌患者的總生存率和生活質(zhì)量。
肺癌的發(fā)病率和死亡率在全球排名第一,是全球腫瘤相關死亡的主要原因。隨著人類癌癥基因組的解碼和針對驅(qū)動突變的療法的出現(xiàn),目前治療能更精確選擇靶向特定基因進行治療。與常規(guī)化學治療相比,靶向藥物具有更高的反應率和更少的毒性。此外,隨著對腫瘤細胞與免疫系統(tǒng)相互作用的深入理解,目前還發(fā)展出新的針對抗腫瘤免疫的治療策略 [1]。
然而,雖然研究人員在診斷和治療方面已取得顯著進展,但晚期非小細胞肺癌(non-small cell lung cancer,NSCLC)患者的 5 年總體生存率變化不顯著,且肺癌的發(fā)病率未見明顯下降 [2]。
對于肺癌只有做到「早期檢測、正確診斷、精準治療」,才能從根本上延長患者生存期,提高患者生活質(zhì)量。人工智能為當前行業(yè)科技化發(fā)展的核心特征,得益于計算機技術的發(fā)展和硬件的提升,將人工智能用于醫(yī)療領域大大加速了醫(yī)學技術革命。鑒于肺癌的高發(fā)病率和高死亡率,人工智能在肺癌中的研究和應用進展極為迅速,本文就人工智能技術在肺癌中的應用現(xiàn)狀作一綜述。
1.人工智能技術用于肺結節(jié)篩查
1.1 計算機輔助診斷(computer-aided diagnosis,CAD)系統(tǒng)
目前,越來越多的肺結節(jié)在檢查中被發(fā)現(xiàn),雖然大部分肺結節(jié)為良性病變,但仍有較高比例的早期肺癌。直徑>3 cm 的肺結節(jié)惡變的可能性非常高,因此需高度重視肺結節(jié)的篩查。肺結節(jié)篩查工作量大,易漏診,且醫(yī)師在檢出肺結節(jié)后需準確判別其良惡性,為下一步治療提供建議。
基于上述問題,科研人員和企業(yè)投入大量物力和財力研發(fā)輔助醫(yī)師篩查肺結節(jié)的人工智能系統(tǒng),以幫助放射科醫(yī)師迅速定位疑似結節(jié),并提出診斷意見和治療建議,從而減少誤診和漏診。基于此,各種 CAD 工具正不斷開發(fā),研究表明 CAD 系統(tǒng)能幫助醫(yī)師識別更多結節(jié) [3];此外,其還可通過結節(jié)容積法評估結節(jié)惡性腫瘤的惡性程度和治療反應,客觀分析結節(jié)形態(tài),優(yōu)化工作流程 [4]。
1.2 結節(jié)圖像數(shù)據(jù)庫
CAD 系統(tǒng)可幫助放射科醫(yī)師早期快速定位疑似結節(jié)。然而,其在進行肺結節(jié)檢測、分類和定量評估時必須有一個完善、可重復的計算機斷層掃描(computed tomography,CT)數(shù)據(jù)庫,如肺圖像數(shù)據(jù)庫聯(lián)盟(Lung Image Database Consortium,LIDC)和圖像數(shù)據(jù)庫資源計劃(Image Database Resource Initiative,IDRI)聯(lián)合建立的 LIDC/IDRI 數(shù)據(jù)庫。
該數(shù)據(jù)庫由國家癌癥研究所發(fā)起,國家衛(wèi)生研究院基金會推動,并由食品藥品監(jiān)督管理局、7 個學術中心和 8 個醫(yī)學影像公司共同參與,包含 1 018 例病例,每例均包含臨床胸部 CT 掃描圖像和相關的 XML 文件,且該文件由 4 位經(jīng)驗豐富的放射科醫(yī)師進行兩階段圖像注釋。
在初始階段,每位放射科醫(yī)師獨立檢查每次 CT 掃描圖像,并標記屬于 3 種類型的病變(結節(jié) ≥ 3 mm、結節(jié)<3 mm 和非結節(jié) ≥ 3 mm);在第 2 階段,每位放射科醫(yī)師檢查自己的標記和其他 3 位放射科醫(yī)師的匿名標記,給出最終意見。最終該數(shù)據(jù)庫包含至少 1 位放射科醫(yī)師標記為「結節(jié)」的 7 371 例病變,其中 2 669 例被至少 1 位放射科醫(yī)師標記為「結節(jié) ≥ 3 mm」,且有 928 例(34.7%)4 位放射科醫(yī)師均進行了如此標記。
LIDC/IDRI 數(shù)據(jù)庫為醫(yī)學圖像研究社區(qū)提供了一個公開的參考,為推動 CAD 在臨床實踐中的發(fā)展、驗證和傳播提供重要的醫(yī)學影像研究資源 [5]。我國肺癌患者數(shù)量多,目前各大醫(yī)院都有自己的肺結節(jié) CT 數(shù)據(jù)集,但尚未見類似 LIDC/IDRI 數(shù)據(jù)庫的中國版本。
1.3 人工智能技術在肺結節(jié)篩查中的應用
有學者研發(fā)了一種檢測早期肺結節(jié)的新型 CAD 系統(tǒng),該系統(tǒng)主要由肺實質(zhì)分割、結節(jié)候選檢測、特征提?。ü?22 個特征)和結節(jié)分類 4 個部分組成,并使用 LIDC/IDRI 數(shù)據(jù)集中的公開數(shù)據(jù)集進行訓練和測試。從 80 個 CT 掃描圖像中選擇 6 400 張圖片,共包含 978 個結節(jié),由 4 位放射學家標記。
該 CAD 系統(tǒng)通過快速分割法將肺結節(jié)分為 888 個真結節(jié)和 11 379 個假陽性結節(jié),采用集成分類器隨機森林(random forest,RF)診斷良惡性的準確率、靈敏度、特異度和受試者工作特征(receiver operating characteristic,ROC)曲線下面積(area under curve,AUC)分別為 93.2%、92.4%、94.8% 和 97.6%;與支持向量機(support vector machine,SVM)分類器相比,其使用的 RF 能降低假陽性率,獲得更高的 AUC [6]。
另有研究者利用 LIDC/IDRI 數(shù)據(jù)集的圖像開發(fā)了肺結節(jié)篩查的 CAD 方法。該方法采用圖像處理和模式識別技術,還使用閔可夫斯基函數(shù)、距離度量、點度量向量表示、三角度量和羊齒直徑,最后應用遺傳算法選擇最優(yōu)模型和 SVM 進行分類;最終該方法診斷良惡性的準確率、靈敏度、特異度分別為 93.19%、92.75%、93.33% [7]。隨后的一項研究也利用 LIDC/IDRI 數(shù)據(jù)集中的圖像開發(fā)了一種用于肺結節(jié)分類的方法。該方法同樣采用圖像處理和模式識別技術,并使用形狀測量,通過形狀圖、比例測量和基于圓柱的分析判別結節(jié)形狀,隨后將該方法應用于 LIDC/IDRI 數(shù)據(jù)庫中的 833 幅圖像,并進行 k 重交叉驗證,最終其分類結節(jié)與非結節(jié)的平均準確率為 95.33% [8]。
CT 檢測肺結節(jié)所得圖像為多維度圖像。三維卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)能充分利用肺結節(jié)的空間三維上下文信息,采用多視角策略,提高二維 CNN 對肺結節(jié)的分類和靈敏度,減少假陽性率。有研究對 CT 檢測肺結節(jié)的自動三維技術進行了綜述,其中有幾項研究被認為有助于醫(yī)療診斷輔助工具的構建,但仍需注意改善和優(yōu)化算法,以提高對不同大小和形狀的不同種類結節(jié)的檢測能力、與電子病歷系統(tǒng)和相關圖像存檔和通信系統(tǒng)的整合能力 [9]。
一項研究利用三維 CNN 從 CT 圖像中自動檢測肺結節(jié),與二維 CNN 相比,三維 CNN 可對更豐富的空間信息進行編碼,通過分層提取更有代表性的特征 [10]。
另一項研究利用三維多視點卷積神經(jīng)網(wǎng)絡(multiple view-convolution neural network,MV-CNN)對肺結節(jié)進行分類,該網(wǎng)絡具有鏈結構和有向無環(huán)圖結構,包括三維 Inception 和三維 Inception-ResNet;對 LIDC/IDRI 數(shù)據(jù)集中的 CT 圖像進行二值分類(良性、惡性)和三元分類(良性、原發(fā)性惡性和轉(zhuǎn)移性惡性),可發(fā)現(xiàn)三維 MV-CNN 的性能優(yōu)于二維 MV-CNN,最終三維 Inception 網(wǎng)絡在二值分類上的錯誤率為 4.59%,在三元分類的錯誤率為 7.70% [11]。
目前,基于人工智能技術的肺結節(jié)篩查大賽也在迅速展開,比較知名的有天池醫(yī)療人工智能大賽(TianCHi)、LUNA16 和 Kaggle 大賽。TianCHi 以「人工智能輔助醫(yī)療決策」為主題開發(fā)算法模型,檢測 CT 圖像中的肺結節(jié)區(qū)域;大賽數(shù)據(jù)集包含數(shù)千份高?;颊叩牡蛣┝糠尾?CT 圖像(mhd 格式),每張圖像包含一系列胸腔的多個軸向切片,層厚<2 mm,其原始圖像為三維圖像,由不同數(shù)量的二維圖像組成(https://tianchi.aliyun.com/competition)。
LUNA16 使用公開可獲得的 LIDC/IDRI 數(shù)據(jù)庫,數(shù)據(jù)集中切片厚度均<2.5 mm,共有 888 份肺部 CT 樣本,比賽參考標準是 4 位放射科醫(yī)師中有 3 位接受的>3 mm 的結節(jié);參與者提出的算法模型靈敏度均超過 95%。4 位放射科醫(yī)師的最終觀察表明,最好的人工智能系統(tǒng)可以檢出那些最初注釋 LIDC/IDRI 數(shù)據(jù)的專家漏診的小結節(jié) [12]。
Kaggle 數(shù)據(jù)集中有 1 000 張來自高危患者的低劑量肺部 CT 圖像(dicom 格式),每張圖像包含多個胸部的軸向切片;該比賽的任務是建立一種自動化方法以確定患者是否會在 1 年內(nèi)被診斷出惡性腫瘤(https://www.kaggle.com/)。
2.人工智能技術用于肺癌病理診斷與分類
組織病理和細胞病理診斷是肺癌診療過程中不可或缺的一環(huán)。有研究者擬通過人工智能技術對不同類型肺癌(腺癌、鱗狀細胞癌、小細胞癌)進行分類,以提高病理診斷的準確性和穩(wěn)定性。該研究開發(fā)了一種利用深度卷積神經(jīng)網(wǎng)絡(deep convolution neural network,DCNN)的自動分類方案,由 3 個卷積層、3 個池化層和 2 個全連接層組成,顯微圖像的分辨率為 256×256 像素;為防止過度擬合,通過旋轉(zhuǎn)收集圖像增強、翻轉(zhuǎn)、過濾,利用三重交叉驗證對分類精度進行評估,結果約 71% 的圖像可被正確分類 [13]。該技術在識別肺癌細胞病理學過程中分類正確和錯誤的典型圖例見圖 1 [13]。
根據(jù)病理切片富含的信息可對肺癌患者預后進行精準的判斷。一項研究使用腫瘤基因組圖譜(The Cancer Genome Atlas,TCGA)的 2 186 張肺腺癌和肺鱗狀細胞癌的石蠟組織切片的全掃描圖像以及 294 張組織微陣列(tissue microarray,TMA)數(shù)據(jù)庫的圖像,抽取了 9 879 張圖像的定量特征并運用機器學習算法選取排名靠前的特征,結果顯示這些特征可以很好地預測肺腺癌(P<0.003)和肺鱗狀細胞癌(P<0.023)患者的生存時間。
此外,利用 TMA 數(shù)據(jù)庫中的數(shù)據(jù)驗證評估模型的準確性發(fā)現(xiàn),其預測這 2 類腫瘤的準確性差異有統(tǒng)計學意義(P<0.036),結果充分表明自動獲取的病理圖像特征可幫助預測肺癌患者的預后 [14]。
3.人工智能技術預測肺癌患者的預后
Sesen 等 [14] 利用貝葉斯網(wǎng)絡(Bayesian network,BN)結合肺癌臨床數(shù)據(jù)為肺癌患者制定個性化的生存預測和治療選擇。該研究基于英國肺癌數(shù)據(jù)庫(lung cancer audit database,LUCADA)評估了 BN 進行生存預測和治療選擇的可行性,同時比較了各種因果發(fā)現(xiàn)方法的性能,從專家知識和數(shù)據(jù)中探尋最可行的網(wǎng)絡結構,結果顯示 BN 的 ROC AUC 僅為 0.75±0.03,而經(jīng) CAMML(causal minimum message length)混合因果結構發(fā)現(xiàn)算法學習后其 AUC 可達 0.81±0.03。
Lynch 等 [16] 將線性回歸、決策樹、梯度增強機(gradient boosting machine,GBM)、SVM 和自定義集成等大量監(jiān)督學習技術用于 SEER(Surveillance,Epidemiology and End Results Program)數(shù)據(jù)庫,通過對腫瘤分級、大小、階段和數(shù)量,以及患者性別、年齡的初選,對肺癌患者的生存進行分類,最終比較不同方法的預測能力。
結果顯示,預測性能最好的技術是自定義集成,其根均方差(RMSE)值為 15.05。在生成的 5 個單獨模型中,最精確的模型為 GBM(RMSE 值為 15.32),雖然 SVM 的 RMSE 值為 15.82,但統(tǒng)計分析將其作為唯一生成獨特輸出的模型。表明這些監(jiān)督學習技術應用到肺癌 SEER 數(shù)據(jù)庫中可以用來評估患者的生存時間,告知患者護理決策的最終目標。
4.導航輔助的計算機視覺系統(tǒng)與肺癌診療
隨著早期肺癌檢出率的提高,肺癌治療理念也發(fā)生相應改變,目前認為不僅要消除腫瘤,還要最大程度保留肺功能。因此,介入消融、胸腔鏡切除等微創(chuàng)手術治療肺癌的方式進入了「段時代」。通過影像檢查進行腫瘤及周邊組織的三維重建可以對肺癌手術評估精準到肺支氣管段、術前模擬手術導航、術中全程三維量化實時導航,最終實現(xiàn)全面、準確和直觀助力肺癌的精準手術或微創(chuàng)治療。
具體來說,手術前通過智能手段精準定位出病灶位置及病灶與周圍血管、氣管、支氣管段的空間毗鄰關系,從而通過交互式三維模型實施虛擬手術。術中將影像實時交互定量化技術帶入微創(chuàng)介入導航,機器人全程實時定位手術器械,臨床醫(yī)師根據(jù)需要任意調(diào)整分割面的位置、角度、曲度,調(diào)整進針點、進針角度和深度、進針路徑及消融范圍等。
該方式對各類胸腹部腫瘤微創(chuàng)介入手術(如射頻消融、微波消融、冷凍消融等)均能起到輔助作用,智能外科理念在手術治療的各個環(huán)節(jié)都會得到體現(xiàn)。
在支氣管鏡檢查中,導航輔助的計算機視覺系統(tǒng)是極具吸引力的低成本解決方案,其可以指導內(nèi)窺鏡醫(yī)師對周圍病變進行活組織檢查和組織學分析。有研究提出一種解耦的深度學習體系結構,將輸入幀投射到 CT 渲染的領域,允許從特定患者的 CT 掃描數(shù)據(jù)中進行離線訓練。
在圖形處理單元(graphic processing unit,GPU)上實現(xiàn)了一個完整的卷積網(wǎng)絡體系結構,并在一個包含 32 個視頻序列和 60 000 幀的偽數(shù)據(jù)集上進行測試;研究結果顯示該體系的平均深度估計精度為 1.5 mm,比傳統(tǒng)的輸入幀直接深度估計高出 60%,計算時間為 30 ms,估計的深度與真實情況相似 [17]。
計算機輔助技術在肺癌切除中應用的研究較多,一項研究分析了機器人輔助胸椎手術(robot-assisted thoracic surgery,RATS)與視頻輔助胸椎手術(video-assisted thoracic surgery,VATS)對 NSCLC 患者肺葉切除的可行性和安全性;該研究納入了 12 項隊列研究,共 60 959 例患者,結果顯示 RATS 術后死亡率明顯低于 VATS,但這與其中 6 項匹配研究的結果不一致,兩種術式的發(fā)病率差異并無統(tǒng)計學意義 [18]。
另一項研究開發(fā)了一套基于知識的治療規(guī)劃算法,并將該算法應用于行立體定向體放射治療(stereotactic body radiotherapy,SBRT)的肺癌患者。該研究納入了治療肺癌患者的 105 個 SBRT 計劃,包括 97 個調(diào)強放射治療(intensity-modulated radiotherapy,IMRT)、6 個旋轉(zhuǎn)調(diào)強放射治療(volumetric-arcradiotherapy,VMAT)和 2 個三維適形放射治療(conformal radiation therapy,CRT),結合上述技術進行基于知識的模型(knowledge-based model,KBM)訓練,多次驗證結果表明 KBM 可用于產(chǎn)生與臨床計劃相當?shù)姆伟?SBRT 計劃 [19]。
5.人工智能技術預測肺癌的免疫治療療效
腫瘤免疫治療是近幾年腫瘤治療領域最成功的方法之一,免疫治療方法很多,其中免疫檢查點抑制劑是國際腫瘤免疫治療的主要方向。T 淋巴細胞為人體免疫細胞,其表面表達程序性死亡蛋白 1(programmed cell death 1,PD-1),正常情況下能識別感染細胞并予以破壞,而腫瘤細胞表面表達程序性死亡蛋白配體 1(programmed cell death ligand 1,PD-L1),其與 T 淋巴細胞表面的 PD-1 結合后使 T 淋巴細胞失去鑒別能力,從而無法識別和殺死腫瘤細胞。PD-1 抑制劑可結合 PD-1,使 T 淋巴細胞重新識別并摧毀腫瘤細胞。
該療法的目的是調(diào)動人體自身的免疫系統(tǒng),阻斷 PD-1/PD-L1 信號通路,促使腫瘤細胞死亡,提高患者總生存率和生活質(zhì)量。如 PD-L1 抑制劑 durvalumab 可延長局部晚期不可切除的Ⅲ期 NSCLC 患者的無疾病進展時間(progression-freesurvival,PFS),durvalumab 組患者的中位 PFS 遠高于安慰劑組(16.8 個月 vs 5.6 個月) [20]。
然而,針對免疫檢查點的治療并非對所有患者有效,目前主要是通過檢測腫瘤細胞的 PD-L1 表達水平判斷療效。Keynote-042 研究顯示 PD-L1 的表達與療效密切相關,PD-L1 表達水平越高,免疫治療給 NSCLC 患者帶來的獲益越明顯 [21]。
PD-L1 檢測方法簡單、方便、直接,對染色技術要求不高,但存在較多問題:(1)醫(yī)療資源的不平衡導致檢測方法和流程統(tǒng)一性差;(2)醫(yī)師判讀主觀性過強,主要根據(jù)形態(tài)學和陽性染色分布,存在腫瘤異質(zhì)性、組織細胞染色、非特異性染色等多種干擾因素,為準確評估染色結果,病理科一般會安排 2 位合格醫(yī)師對同一檢測結果實行背靠背判讀,不一致時則請第 3 位醫(yī)師或科內(nèi)討論,占用了醫(yī)師正常工作時間;(3)創(chuàng)造性差,顯微鏡下病理醫(yī)師只能判斷是否染色和染色強度,難以給出定量數(shù)據(jù),而陽性染色的定量以及與周圍組織的空間距離可能有助于預測療效和評估預后。
人工智能技術已成功應用于腫瘤病理圖片中腫瘤細胞的分割、識別,也能準確定量免疫組織化學染色結果。深度學習技術同樣可用于識別肺癌組織中 PD-L1 的表達,且其結果的客觀性和重復性強,不存在人為誤差;此外,其還能識別切片中的淋巴細胞、腫瘤細胞和間質(zhì),通過三維重建顯示各種細胞間的空間分布,而這種空間分布也是判斷免疫治療療效的潛在因素之一 [22]。
綜上所述,人工智能技術在肺癌早期篩查、病理診斷和分類、預后評估、手術導航和免疫治療等方面都取得了一定進展,證實了人工智能技術在肺癌診療中的可行性。然而,由于缺乏具體的臨床應用場景、標準的數(shù)據(jù)庫(尤其是國內(nèi))、統(tǒng)一的規(guī)范或?qū)<夜沧R以及相應的國家政策法規(guī),肺癌人工智能的落地還需較長一段時間,尚需科研工作者和企業(yè)踏實建立自己的數(shù)據(jù)庫和行業(yè)標準,突破技術瓶頸,為肺癌人工智能的發(fā)展作貢獻。