5 在做WGCNA分析时,基因表达数据文件的基因的ID在最后一列,由于数据量很大,改动可能造成数据混乱,所以想请问一下,代码需要做怎么的改动让他识别左后一行才是名称呢?

请先 登录 后评论

最佳答案 2019-03-01 16:06

如果用的是read.table 参考一下https://www.omicsclass.com/article/98   注意设置row.names的参数 为特定的列,获得的矩阵将会行名是基因ID



下问代码:row.nams=A  A值基因名的列数,你自己改成对应的数字吧。

fpkm = read.table("lx_otu_table.xlsx",header=T,row.names=A,comment.char = "",check.names=F)
dim(fpkm)
datExpr0=as.data.frame(t(fpkm))
dim(datExpr0)


另注意文件 只能是文本,xlsx后缀 可能是个真excel,转换成普通文本使用吧

请先 登录 后评论

其它 1 个回答

南瓜饼

感谢回答,还想继续问一下,我的数据时这样的

attachments-2019-03-6Xk1l5y75c78d736796b6.jpg代码是这样:

fpkm = read.table("lx_otu_table.xlsx",header=T,comment.char = "",check.names=F)

dim(fpkm)

names(fpkm)
datExpr0 = as.data.frame(t(fpkm[,-1]))
names(datExpr0) = fpkm$ID;

rownames(datExpr0) = names(fpkm[,-1])

所以是要改最后一行吗?应该怎么改呢?

请先 登录 后评论
  • 2 关注
  • 0 收藏,3356 浏览
  • 南瓜饼 提出于 2019-03-01 13:06

相似问题