R语言对基因表达量数据RNA-seq做PCA分析

PCA(principal component analysis )主成分分析,可以分析样品之间相关性,确定样品总体上的差异,或者查看是否有批次效应等

输入数据:

attachments-2018-06-4otjU74w5b23bb986f3fd.png

代码部分,筛选基因也可以参照另一篇文章,而不一定是选取200个变化最大的基因,R筛选基因


myfpkm<-read.table("All_gene_fpkm.xls",header=TRUE,comment.char="",sep = "\t",check.names=FALSE,row.names=1)
probesetvar = apply(myfpkm, 1, var) #表达变化大的基因
ord = order(probesetvar, decreasing=TRUE)[1:200] #前200个基因,或者更多
pca = prcomp(t(myfpkm[ord,]), scale=TRUE)
ss=summary(pca) #绘图:
plot(pca$x[,1:2],col=rep(c(1,2,3,4,1,2,3,4),each=3),pch=rep(c(16,17),each=12))
#或者3D:
library(scatterplot3d)
scatterplot3d(pca$x[,1:3],color=rep(c(1,2,3,4,1,2,3,4),each=3),pch=rep(c(16,17),each=12))

attachments-2018-06-XoRqbPhy5b23bba3a2692.pngattachments-2018-06-sN5ZObFx5b3447890610f.jpg

参考文献:https://www.nature.com/articles/nprot.2009.97

更多生物信息课程:https://study.omicsclass.com/index


  • 发表于 2018-06-04 15:21
  • 阅读 ( 28888 )
  • 分类:转录组

0 条评论

请先 登录 后评论
omicsgene
omicsgene

生物信息

698 篇文章

作家榜 »

  1. omicsgene 698 文章
  2. 安生水 347 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 74 文章
  8. CORNERSTONE 72 文章