文獻摘要: Body composition radiomics combined with machine learning for early recurrence prediction in intrahepatic cholangiocarcinoma following curative surgery A Multi Center study
Objectives
這項多中心研究開發並驗證了整合放射體學-臨床機器學習 (RCML) 模型,用於預測肝內膽管癌 (ICC) 根治性手術後的早期復發 (ER)。研究證明,相較於傳統的僅臨床或僅放射體學模型,身體組成放射體學 (body composition radiomics) 能顯著提升 ER 預測能力。本研究提出了一種新穎方法,利用常規術前 CT 影像量化全身代謝-免疫狀態,以實現個人化風險分層。此外,研究識別出特定的身體組成放射體學特徵,例如 SAT 衍生的 wavelet features 和 SM 紋理指標,作為主要預測因子,提供了超越傳統腫瘤特徵的生物學可解釋性。
Methodology
本研究採用回溯性多中心設計,納入了 258 名肝內膽管癌 (ICC) 患者。術前對比增強 CT (L3 level) 影像用於身體組成分析。透過驗證過的 Hounsfield unit (HU) 閾值,分割出四個身體組成區塊:皮下脂肪組織 (SAT)、內臟脂肪組織 (VAT)、肌肉間脂肪組織 (IMAT) 和骨骼肌 (SM)。所有影像均經過標準化預處理,包括空間正規化和強度協調。使用 PyRadiomics 提取了總計 6,580 個放射體學特徵。透過評估觀察者內和觀察者間的重現性 (ICC ≥ 0.75) 確保特徵的穩健性。特徵選擇採用了最小冗餘最大相關性 (mRMR) 分析,隨後進行逐步前向選擇,最終得到 15 個最佳放射體學特徵子集。六種機器學習 (ML) 演算法(Decision Tree, Random Forest, Multi-Layer Perceptron (MLP), Support Vector Machine (SVM), Logistic Regression, Gaussian Naive Bayes (GaussianNB))透過自動化超參數調優 (Hyperopt) 和五折交叉驗證進行優化。模型變體包括僅放射體學 (RML)、僅臨床 (CML) 和整合放射體學-臨床 (RCML) 模型。類別不平衡問題透過 SMOTETomek 重採樣解決。模型性能透過受試者工作特徵曲線下面積 (AUC)、決策曲線分析 (DCA)、敏感度、特異度、F1-score 和 Brier score 進行評估,並在獨立的患者群體上進行外部驗證。基於 SVM 的模型之間的統計差異使用 DeLong’s test 進行驗證。
Results
在 258 名患者中,有 134 名 (52%) 發生早期復發 (ER)。最佳的放射體學機器學習 (RML) 模型以 15 個選定特徵達到了 0.82 的 AUC,顯著優於僅使用臨床變數的模型(平均 AUC 0.72)。基於 Support Vector Machine (SVM) 的整合放射體學-臨床機器學習 (RCML) 模型表現卓越,訓練 AUC 為 0.86,外部驗證 AUC 為 0.84。此 RCML 模型達到了平衡的分類指標,包括敏感度 0.80、特異度 0.87 和 F1-score 0.82。DeLong’s test 證實 RCML 模型顯著優於 CML 模型(AUC 差異:0.12;P=0.043)和 RML 模型(AUC 差異:0.04;P=0.004)。所有表現最佳的模型都能顯著區分高風險和低風險組,且生存率存在顯著差異 (log-rank P<0.001)。RCML 模型顯示出最顯著的分層效果,高低風險組之間的風險比 (HR) 為 2.69 (95% CI: 2.00-3.63),顯著優於僅臨床 (HR 2.51) 和僅放射體學 (HR 2.20) 方法。

Discussions
這項多中心研究的回溯性設計,儘管透過驗證降低了部分過度擬合的風險,但本質上限制了建立因果推斷的能力。前瞻性研究將有助於強化證據。身體組成區塊的手動分割可能引入觀察者變異性,進而影響特徵的重現性。未來的研究應探索基於深度學習的自動化分割方法,以提高一致性和效率。此外,儘管本研究為識別出的放射體學特徵(例如 SAT 異質性、SM 紋理)提供了生物學上合理的解釋,但仍需要透過相關組織分析(例如 L3 level 肌肉和脂肪組織的單細胞 RNA 定序)進行直接的生物學驗證,以明確確認這些機制基礎。