再挖TCGA,发篇SCI

再一次给大家介绍一篇不用做实验,只需要进行TCGA数据库挖掘,就能发的SCI的金思路

今天再一次给大家介绍一篇不用做实验,只需要进行TCGA数据库挖掘,就能发的SCI的金思路。接下来以一篇2018年7月30日发表在Cellular Physiology and Biochemistry(IF=5.5)上题为Genome-Wide Analysis of Prognostic lncRNAs, miRNAs, and mRNAs Forming a Competing Endogenous RNA Network in Hepatocellular Carcinoma 的文章为例,详细介绍下该类文章的写作思路!

该文章思路清晰明了,分别针对癌症和癌旁的lncRNA,miRNA,mRNA进行差异分析,生存分析,并构建ceRNA调控网络,再对网络中的分子进行功能分析;整个分析过程一气呵成,值得学习和参考。

1. 数据来源

从TCGA数据库中下载肝癌的374份癌症组织和50份癌旁组织的基因和lncRNA表达数据。从UCSC Xena 下载相应肝癌的miRNA数据。

2. 差异表达分析

基于374份肝癌样本和50份癌旁样本的基因,lncRNA,和miRNA表达数据,进行差异表达分析,筛选差异表达的分子。


差异表达的火山图如下:

attachments-2018-11-pBvdOQOH5beb7e6f0488f.jpg

差异表达聚类热图如下:

attachments-2018-11-qiVDCjpS5beb7e637fc99.jpg

3. 生存分析

3.1 单因素生存分析

基于差异表达的结果,分别针对差异表达的分子与临床数据中的总生存时间进行单因素的COX生存分析,最终得到77个lncRNA, 29个 miRNA, 1014个mRNA与生存显著相关。

生存相关lncRNA, miRNA,mRNA的风险比例深林图如下:

attachments-2018-11-fM9hFLcA5be55a1117359.jpg

3.2 多因素生存分析

基于单因素的分析结果,进一步采用多因素的COX回归模型进行分析,最终分别筛选了3个分子构建了预后指数。   
基于预后指数,参考中位数,可以将病人分成两组,分别是高风险组和低风险组。


针对两个分组,进一步采用K-M生存分析,得到预后指数的分类效果。从P值的大小来看,分类效果很好。  

基于预后指数进行KM分析,获得的生存曲线图如下:

attachments-2018-11-mjIlL0b85be55a4956153.jpg

基于预后指数进行预测效果检验,绘制检测效果的ROC曲线如下:

attachments-2018-11-LprQlhTD5be55a5fa4008.jpg

从ROC曲线的AUC值来看,分类效果还不错,都在0.7 以上。

4. ceRNA网络构建

基于生存分析筛选出来的显著相关lncRNA, miRNA, mRNA 构建ceRNA网络。网络包括两部分,分别是:

1. lncRNA-miRNA 相互作用: 采用miRcode 网站进行预测; 

2. miRNA-mRNA的相互作用: 基于TargetScan,miRTarBase,miRDB 等软件和数据库进行预测。

构建的ceRNA网络如下:

attachments-2018-11-CKBZ8LWz5be55a6e00a1d.jpg

5. 基因功能分析

针对ceRNA网络中的mRNA进行GO,KEGG的功能注释和分析。从中可以发现一些基因跟细胞周期,P53 信号途径,癌症相关miRNA等通路相关。

KEGG 代谢通路注释如下:

attachments-2018-11-xRTLIFx65be55a7a1b9f1.jpg

GO功能注释如下:

attachments-2018-11-fVO1g4U25be55a84cdec4.jpg

6. 文章亮点

  1. 文章的思路简单明了:从差异分析到生存分析,ceRNA以及功能分析,一步步紧扣,一气呵成。

  2. 分析对象系统而全面:从lncRNA, miRNA,mRNA等多个层面去分析,并构建相互作用的调控网络,使得分析结果更加具有说服力。

  3. 图表简洁美观: 文章中的图表非常多,而且简洁美观。

参考文献:Genome-Wide Analysis of Prognostic lncRNAs, miRNAs, and mRNAs Forming a Competing Endogenous RNA Network in Hepatocellular Carcinoma. Cell Physiol Biochem,2018; 48: 1953-1967.


TCGA-生存分析

TCGA-基因差异表达分析

TCGA-转录因子调控

TCGA-ceRNA调控网络分析

  • 发表于 2018-11-09 17:40
  • 阅读 ( 5323 )
  • 分类:TCGA

0 条评论

请先 登录 后评论
microRNA
microRNA

115 篇文章

作家榜 »

  1. omicsgene 702 文章
  2. 安生水 350 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 76 文章
  8. CORNERSTONE 72 文章