Py学习  »  机器学习算法

IF=10.3,单细胞多组学+TWAS+机器学习,干细胞潜能分析新范式出现!

挑圈联靠 • 2 月前 • 163 次点击  

已经连续拆解了2天针对肿瘤的单细胞研究文献,非肿瘤疾病还可以参考哪些思路呢?今天雪球用一篇IF10+的文献讲解,公共数据怎么做发育重编程呢?一起来看看吧!


Multi-omics Dissection of High TWAS-Active Endothelial Pathogenesis in Pulmonary Arterial Hypertension: Bridging Single-Cell Heterogeneity, Machine Learning-Driven Biomarkers, and Developmental Reprogramming

多组学解析肺动脉高压中高TWAS活性的内皮发病机制:连接单细胞异质性、机器学习驱动的生物标志物与发育重编程


期刊:International Journal of Surgery

IF:10.3

发布时间:2025/10/09


 技术路线 


人群 TWAS 扫描  

目的:从遗传层面筛选与 PAH 显著相关的可表达基因。  

方法:利用 FinnGen R11 316 622 例汇总数据(277 PAH/316 345 对照),FUSION 软件跨 49 种组织进行表达插补与关联检验。  

结果:115 个基因 P<0.01,富集 IL-17、FOXO、泛素化等通路,为下游单细胞分析提供基因列表。

scRNA-seq 数据获取与质控  

目的:构建高质量单细胞图谱。  

方法:GEO 下载 GSE169471 & GSE210248,共 17 例样本;Seurat 过滤线粒体<20%、基因数 200–7000,最终 44 647 细胞。Harmony 去批次。  

结果:获得 21 个稳定聚类,注释为内皮、巨噬、T/NK、成纤维等 12 种主要细胞类型。

单细胞 TWAS 活性评分  

目的:量化每个细胞中 PAH 遗传危险信号的转录活性。  

方法:采用 AUCell、UCell、ssGSEA、AddModuleScore 四种算法,对 115 个 TWAS 基因集进行单细胞打分;Z-score+Min-Max 标准化后求和得综合评分。  

结果:内皮细胞综合评分显著高于其他细胞;评分呈正态分布,可四分位划分 LTS/MTS/HTS。

HTS 亚群鉴定与组织偏好  

目的:明确高遗传危险信号细胞的表型特征与样本来源偏好。  

方法:按 75% 分位数切点定义 HTS;Ro/e 比值、MiloR 差异丰度检验。  

结果:HTS 显著富集于 PAH 样本(31.5% vs 21.1%),提示疾病特异性扩张。

干细胞潜能与拟时序分析  

目的:判断 HTS 是否具备祖细胞/去分化特征。  

方法:CytoTRACE(转录多样性指标)、Slingshot & Monocle2 轨迹推断。  

结果:HTS CytoTRACE 评分最高,位于拟时间起始端,提示其处于更原始的分化状态,可能驱动血管重塑。

细胞间通讯与代谢特征  

目的:解析 HTS 如何重塑微环境。  

方法:CellChat 构建配体-受体网络;scMetabolism 计算 85 条代谢通路活性;GSVA 富集 hallmark。  

结果:HTS  outgoing 信号(SPP1、MIF、VEGF 等)显著增强;TGF-β、顶端连接、凝血通路激活;糖酵解、脂肪酸氧化等代谢通路重编程。

机器学习特征基因筛选  

目的:从 115 个 TWAS 基因中提炼可区分 HTS 的极简分子标志。  

方法:7 种算法(LASSO/RF/XGBoost/Boruta/GBM/ABESS/DT)分别做二分类(HTS vs LTS),取交集。  

结果:一致锁定 3 基因——KLF2、RASIP1、 DEPP1

模型基准测试与诊断效能  

目的:评估三基因对 HTS 状态的预测能力及算法稳健性。  

方法:9 种分类器(mlr3 框架,内 5 折调参、外 10 折验证),绘制 ROC、PR 曲线;单基因 ROC 对比。  

结果:随机森林平均 AUC 最高(0.862);单基因 AUC 0.66–0.74,三基因联合显著提升精度。

特征基因表达与功能关联  

目的:验证三基因在单细胞及 bulk 水平的表达差异,并解析 KLF2 的功能角色。  

方法:Wilcoxon 比较 PAH vs 对照;Pearson 相关分析 KLF2 与 TWAS 评分;CellChat 比较 KLF2+ vs KLF2− 内皮细胞的通讯强度。  

结果:三基因在 PAH 内皮显著高表达;KLF2 与 TWAS 评分高度正相关(r>0.7);KLF2+ 内皮与单核/巨噬 MIF 信号增强,可能促进炎症与异常血管生成。

动物模型验证  

目的:在体内确认三基因随 PAH 病程上调。  

方法:慢性缺氧(10% O₂,5 周)诱导小鼠/大鼠 PAH;超声测 PAT、导管测 RVSP;qRT-PCR 与 IHC 检测肺组织表达。  

结果:缺氧组 RVSP 升高、RV 肥厚指数增加;肺小动脉内膜增厚;KLF2、RASIP1、DEPP1 mRNA 与蛋白均显著升高,与血流动力学指标正相关。


 研究结果 


Fig 1 通过TWAS鉴定与PAH相关的基因


Fig 2 PAH中的单细胞景观


Fig 3 正常与PAH样本之间TWAS活动的区别


Fig 4 鉴定HTS亚组


Fig 5 不同TWAS活性下PAH内皮细胞的生物学功能差异


Fig 6 多种机器学习算法识别出具有TWAS活性的特征基因


Fig 7 特征基因的评估与验证


Fig 8 TWAS内皮细胞中KLF2阳性表达的通讯功能分析


Fig 9 KLF2、RASIP1和DEPP1在缺氧诱导的肺动脉高压小鼠模型中的验证


雪球

科研交付中心

负责人

这一套生信分析思路,如何丝滑过渡到自己的疾病领域课题中?请看👇


可复用模块

✅TWAS活性评分与细胞亚群鉴定模块

需根据目标疾病的细胞类型数量调整分位数阈值


✅机器学习驱动生物标志物发现模块

整合的算法可继续升级,如引入图神经网络建模细胞间相互作用,最终提升特征选择的生物学可解释性。


✅细胞互作与轨迹分析

通过CellChat分析配体-受体互作,结合Monocle2/CytoTRACE推断细胞分化轨迹。可复用至器官再生模型、胎盘发育分化路径等课题中。



前沿算法的出现,给多学科深度交叉融合提供了更多的可能性。机制+转化的科研范式,是冲击二区一区高分期刊的核心增长点。


结合 CytoTRACE,可为每个细胞附上潜能分值,更全面、直观地解释疾病发展过程及肿瘤异质性,为潜在治疗靶点提供依据。


👇如果想从这个角度入手做升级,来找雪球,添加后回复“个性化”开始咨询吧!

如果想要更多灵活的套路组合、进阶的分析手段,👇添加雪球后,回复“个性化”详细咨询~

10+种套路大类,更多套路组合,不限疾病,多种选择

专业分析工程师团队助你高效率拿成果!

别忘了添加后回复“个性化”详细咨询


 雪梨的复现妙妙屋,每月更新生信文章SCI复现教程!想上进的同学,已经点进合集查缺补漏了👆

 雪球的医学科研课堂 每周周中讲解 

星标⭐才不会错过更新哦

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/192604