GEO数据的处理问题(没有NCBI官方注释文件情况)

attachments-2019-01-U7VXNK2k5c37508acf255.jpg

attachments-2019-01-ONv251K05c3750cdd3dca.jpg

我从soft文件里头提取出Ensemble_ID和GENE symbol,但是现在出现多个Ensemble_ID,我在和ENTREZID对应的过程中,这些多个Ensemble_ID对应之后以NA返回,这个情况要怎么处理呢?

请先 登录 后评论

2 个回答

Daitoue

重新描述一下问题吧,什么叫出现多个Ensemble_ID?一个探针检测多个基因的意思?这种情况在数据分析过程的视频里面有说过,针对一探针对应多基因的请剔除。



补充:简单看了一些,这个算双通道芯片数据,目前还不太适合直接使用我们课程的代码(主要用于单通道数据分析),你可以去了解一些这两种芯片的差别。另外,你给的图片的第一张对应的第一行应该就是相对于探针ID,通过行名和表达数据的行名对应(1、2、3、4.。。。)

attachments-2019-01-ChDASz1H5c386b42d8eaf.jpg

请先 登录 后评论
 zxlll

就像图一的情况,图一是我从一个soft文件里面提取出来的Ensemble_ID和Genesymbol,图一第二行里头有三个ID和三个symbol,最后和ID_list匹配,这一行就会出现<NA>,像这种情况要怎么解决

请先 登录 后评论
  • 2 关注
  • 0 收藏,7848 浏览
  •  zxlll 提出于 2019-01-10 22:07

相似问题