临床前模型构建与CT影像采集
建立HRD与同源重组 proficient(HRP)的对比模型,获取治疗前后影像数据。
使用307只小鼠,携带三种同基因异种移植瘤(LNCaP AR前列腺癌、HCT116和DLD-1结直肠癌),包括FANCA-/-、FANCD2-/-、BRCA2-/-(HRD)及野生型/DNA-PKcs-/-(HRP)。在CP-506(缺氧激活前药)或对照治疗前及治疗后6、24、48、72小时进行显微CT扫描(40kVp和80kVp双能量)。
获得543张可分析CT扫描(414张无治疗扫描用于分类任务,129张治疗后扫描用于反应预测)。
肿瘤区域(ROI)分割
采用半自动化流程:先用20例手动标注训练DynUNet分割模型,生成候选轮廓,再经四人联合审核校正,获得所有扫描的标准化肿瘤ROI。
HRD状态分类模型开发(三种方法对比)
1 手工影像组学(HCR)
提取93个基础特征(一阶统计、GLCM、GLSZM等)及372个LoG滤波后特征;经Z-score归一化、相关性聚类、Lasso降维后,用SVM分类。评估传统预定义特征对HRD的预测能力。
训练集AUC 0.77–0.79,测试集AUC 0.70–0.76,性能有限且对数据量敏感(10%数据时AUC<0.5)。
2 监督式深度学习(sDL)
使用简化通道的ResNet-50,输入40kVp、80kVp或双通道图像,经数据增强(旋转、翻转、噪声等)训练1,000轮。评估从头训练的深度网络性能。
训练集AUC 0.71–0.78,测试集AUC 0.77–0.85,优于HCR但仍受限于小样本。
3 基础模型(FM,核心方法)
采用基于大规模人类CT预训练的ResNet-50编码器,添加三层MLP(4096→512→64→2)作为分类头,微调学习率10⁻⁶,五折交叉验证。利用预训练权重克服临床前数据稀缺问题。
训练集AUC 0.89–0.90,测试集AUC 0.87–0.88,准确率约85%,显著优于HCR和sDL(p<0.05)。sDL与FM共识亚组(71%病例)AUC达0.93。
治疗反应预测:DNA损伤强度(DDI)
验证HRD相关影像特征能否预测CP-506诱导的微观DNA损伤。
治疗后48小时取肿瘤组织,γ-H2AX免疫组化染色定量DNA损伤;以FM提取的64维HRD相关特征+治疗状态为输入,逻辑回归预测高/低损伤(以中位数二分)。
训练集AUC 0.92,测试集AUC 0.75;预测HRD组在治疗后显示出显著更高的DNA损伤(p<0.001),证实影像特征可捕捉治疗敏感性。
生存分析(事件无生存期,EFS)
评估HRD特征对肿瘤生长延迟的宏观预后价值。
因主实验动物需处死后取组织,采用平行实验(151只小鼠)的肿瘤体积数据拟合Weibull分布,合成主实验的EFS数据(肿瘤体积增至4倍的时间)。使用Cox比例风险模型基于HRD特征计算风险评分,Kaplan-Meier分析比较高/低风险组。
低风险组EFS显著延长(HR=0.25, p<0.0001, C-index=0.69);结合预测HRD状态与风险分层,低危/预测HRD组生存最优,证实影像特征具有预后预测价值。
模型可解释性分析
解析FM决策的生物学基础,识别关键影像特征。
采用回归概念向量(RCV)方法,计算各影像组学特征的可学习性(R²)和双向相关性(Br)评分;对比HCR模型的SHAP值。
87%的特征(269/309)被FM有效学习;纹理异质性(如Coarseness、ClusterShade)是HRD分类的关键,低Coarseness(高异质性)与HRD概率正相关;HCR与FM在12个关键特征中的8个方向一致,但FM捕捉了更多传统方法遗漏的异质性特征。
统计验证
DeLong检验比较ROC曲线,Mann-Whitney U检验比较组间差异,Fisher精确检验评估混淆矩阵,Benjamini-Hochberg校正多重比较,Bootstrap计算95%置信区间。确保结果稳健性。
FM显著优于传统方法(p<0.05),所有主要发现均经多重检验校正后仍显著。