IF=5.7 | 转录组数据揭示类风湿关节炎的临床诊断模型

​“ 2024年6月Frontiers in immunology 杂志发表了一篇题为Integrated analysis of single-cell RNA-seq, bulk RNA-seq, Mendelian randomization, and eQTL reveals T cell-related nomogram mo...

​“ 2024年6月Frontiers in immunology 杂志发表了一篇题为Integrated analysis of single-cell RNA-seq, bulk RNA-seq, Mendelian randomization, and eQTL reveals T cell-related nomogram model and subtype classification in rheumatoid arthritis 的转录组分析文章  文章借助单细胞转录组数据、芯片转录组数据以及eQTL遗传变异数据来筛选类风湿性关节炎中潜在的致病T细胞标志基因。

类风湿关节炎(RA)是一种常见的自身免疫性疾病,全球约有0.5%–1%的人口患有该病。RA的发病机制尚未阐明,仍缺乏有效的治疗方法。
T 细胞调节 RA 疾病的发展,被认为是治疗的关键靶点。因此,文章通过整合多个数据集来探索 RA 的机制。建立了 T 细胞相关的诊断模型,为 RA 免疫治疗提供新方法。fimmu-15-1399856-g001.jpg

从基因表达综合(GEO)数据库中获取类风湿性关节炎的scRNA-seq和bulk-seq数据集。采用多种方法分析和表征类风湿性关节炎的T细胞异质性。利用孟德尔随机化(MR)和表达数量性状位点(eQTL)筛选类风湿性关节炎中潜在的致病T细胞标志基因。随后,通过比较九种机器学习方法对类风湿性关节炎的预测,选择最优机器学习方法识别T细胞相关诊断特征,构建列线图模型。采用共识聚类法将类风湿性关节炎患者分为不同的T细胞相关簇。最后,对T细胞相关诊断特征进行免疫细胞浸润和临床相关性分析。

一、数据准备

在文章分析中用到了eQTL数据,来源于IEU OpenGWAS数据库;

RA GWAS 数据,来源于FinnGen R10 数据库;

scRNA-seq(GSE159117)数据和bulk RNA-seq(GSE93272、GSE89408、GSE77298)数据,来源于NCBI的GEO数据库。

二、结果展示

01. 类风湿性关节炎细胞类型的鉴定

对RA GWAS 数据进行分析,RA数据集中包含10211个细胞,被分为18个簇。对数据进行注释,结果如下:(图A)cluster0、1、2、3、9、10、11、12为T细胞(图B),标记基因为CD3DCD3E(图D),并且T细胞是在RA免疫微环境中最丰富的细胞(图C)。

www.frontiersin.org

02. RA微环境中细胞间相互作用分析

使用 cellchat 包分析了 RA 微环境中 T 细胞与其他免疫细胞之间的关系(图A、B)。

又已知 MIF 信号通路可调节免疫反应和炎症,在 RA 微环境中发挥重要作用,可能影响免疫调节和疾病进展。图C、D、E展示说明T细胞作为信号传递体,主要通过 MIF 信号通路及其相关的配体-受体对(MIF-CD74 + CXCR4 和 MIF-CD74 + CD44)与其他免疫细胞相互作用。

此外,MIF 诱导的配体 CD74 在这些免疫细胞群中高表达(图F),可能与 T 细胞的发育分化密切相关。

www.frontiersin.org

03. 细胞的轨迹

根据T细胞亚型的标记基因,文章将T细胞分为以下7类细胞亚型(图A),不同的T细胞亚型表达不同的标记基因(图B)。

文章通过拟时间轨迹分析将七种T细胞亚型分为三种分化状态。不同状态下T细胞亚型的数量不同。CD8_Naive和CD4_Naive细胞主要富集于T细胞发育早期,主要分化为第一细胞状态;CD8_EM、MAIT和CD8_TE细胞处于第二细胞状态;CD8_CM和CD4_TE细胞处于第三细胞状态(图C)。

同时将T细胞发育过程中的基因变化分为三类,分别与细胞质翻译、免疫应答和T细胞介导的细胞毒作用的正向调控相关(图E)。

图D显示MIF诱导的配体CD74的分布随着分化期的变化而逐渐增加,这表明在RA免疫微环境中,随着T细胞的发育,T细胞对其他免疫细胞的作用逐渐增强。

www.frontiersin.org

04. 识别与RA相关的风险基因

文章从eQTL数据集中识别出309 个与 RA 相关的遗传显著基因,其中,153 个基因表达增加与 RA 风险增加显著相关,而 156 个基因表达增加与 RA 风险降低显著相关(图A)。

05. T细胞相关诊断特征的筛选及列线图模型的构建

基于前面的分析,文章选择了 1639 个 T 细胞标记基因与 309 个与 RA 有因果关系的基因进行交集(图 B),总共获得了 26 个基因,用于构建九个机器学习模型(图C),其中XGB机器学习模型显示出最高的AUC。

我们从XGB结果中挑选前十个基因,看一下在 GSE93272 转录组数据集的健康个体和RA患者中这10个基因的表达(图D),根据表达结果其中8个基因被定义为 T 细胞相关的诊断特征。

之后为了评估 232 例患者罹患 RA 的风险,文章对 8 个 T 细胞相关诊断特征构建了列线图模型(图E),校准曲线显示列线图模型准确预测了 RA。

最后文章用另外两组bulk RNA-seq转录组数据验证了列线图模型,得到 GSE89408 和 GSE77298 的 AUC 分别为 0.958 和 0.875(图F),进一步证明我们的诊断模型在区分 RA 和健康个体方面是有效的。

06. T细胞模式识别和免疫细胞浸润分析

为了研究与 RA 中 T 细胞相关的不同模式,文章根据八种 T 细胞相关诊断特征对 RA 患者进行了聚类分析。将 RA 分为两个不同的 T 细胞簇(cluster 1 和cluster 2)(图A)

PCA 结果显示两种 T 细胞模式之间存在明显区别(图B)。结果显示,且cluster 2 的 T 细胞评分高于cluster 1(图 C)

之后做了差异表达分析(图D)、免疫浸润分析(图E)、8个T细胞相关诊断特征与免疫细胞之间的相关性热图(图F)、以及基因集变异分析GSVA分析(图G)。GSVA 结果显示,Cluster 2 主要与非小细胞肺癌、癌症通路和胰腺癌等癌症有关,而 Cluster 1 在核糖体、RNA 降解和基础转录因子等信号通路中富集

www.frontiersin.org

07. 临床相关性分析

文章做了临床相关性分析,以确定不同 T 细胞模式的 RA 患者之间是否存在年龄和性别差异,并评估 T 细胞相关诊断特征与患者年龄之间是否存在显著相关性。

结果表明,在8个诊断特性下两种不同 T 细胞模式之间的年龄分布没有显著差异,性别比例也没有显著差异。

www.frontiersin.org


更多生信课程:

attachments-2024-07-c4L9hC2d66a89c15b8ed6.png

  • 发表于 2024-07-30 15:50
  • 阅读 ( 663 )
  • 分类:文献解读

0 条评论

请先 登录 后评论
rzx
rzx

75 篇文章

作家榜 »

  1. omicsgene 701 文章
  2. 安生水 349 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 75 文章
  8. CORNERSTONE 72 文章