5 R 语言批量做相关性分析correlation

有很多基因,测了转录组和蛋白质组,需要看看基因之间的相关性,基因太多能批量求每个基因的相关性吗?

请先 登录 后评论

最佳答案 2018-07-22 07:00

可以把每个基因的转录组和蛋白组的表达数据整理成一个表格,每一行代表一个基因,例如我下面的表格整理了,转录组和 蛋白组的表达数据,左边8列是蛋白数据,右边8列是转录组数据,需要对每一行求相关性; 可以做蛋白质组和转录组之间的相关性。

attachments-2018-07-flLs3kTf5b3f13e532fd6.jpg


corResult=apply(fpkm,1,function(x){
  cor(x[1:8],x[9:16],method="spearman")
})
hist(corResult) corResult_test=apply(fpkm,1,function(x){ cor.test(x[1:8],x[9:19],method="spearman",exact = F)$p.value }) table(abs(corResult)>0.65 & corResult_test<0.05)

相关性数值分布:
attachments-2018-07-5OcpKCdm5b3f146a73d83.jpg
Xiao C, Ye J, Esteves RM, Rong C. Using Spearman's correlation coefficients for exploratory data analysis on big dataset. Concurr Comput Pract Exp 2016; 28: 3866–3878.
请先 登录 后评论

其它 1 个回答

Borja

请问,head(fpkm)?输入数据是什么格式呀?

请先 登录 后评论
  • 2 关注
  • 1 收藏,11608 浏览
  • omicsgene 提出于 2018-07-06 14:59

相似问题