在单因素生存分析完成之后,可以绘制一个单因素的生存曲线图。
# 表达信息和生存数据整合到 exprSet, 其格式如下: bcr_patient_barcode time status LINC01587 XXbac_B461K10.4 1 TCGA-2W-A8YY 148 0 3.981761 23.89057 2 TCGA-4J-AA1J 226 0 37.491171 19.63823 3 TCGA-BI-A0VR 1505 0 10.891560 3.63052 4 TCGA-BI-A0VS 925 0 3.877719 19.38859 5 TCGA-BI-A20A 72 0 16.789319 12.21041 6 TCGA-C5-A0TN 348 1 7.835572 28.73043 # 针对显著性的基因绘制生成曲线 my.surv <- Surv(exprSet$time, exprSet$status) # 循环遍历显著的基因 for(gene in names(log_rank_p) ){ values <- exprSet[,gene] # 基于基因的表达量,分成两个组别 group=ifelse(values>median(na.omit(values)),'high','low') kmfit2 <- survfit(my.surv ~ group,data=exprSet) summary(kmfit2) ggsurvplot(kmfit2, conf.int=T, pval=TRUE, title=gene) ggsave(paste(gene,'_survival.pdf', sep = ""),width = 10,height = 5) }
绘制完的图如下:
如果您对TCGA数据挖掘感兴趣,请学习我们的TCGA相关课程:
《GSEA富集分析》
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!