我的物种序列只有NCBI上有公布,在做mRNA和gene的ID对应关系输出的时候出现问题,请问怎么解决?
下面是gff文件的信息:
rna文件信息如下,ID是以XM_开头。
protein文件信息如下,ID是以XP_开头。
对gff文件进行处理时,我用的两条命令是:
#sed –i 's#gene-##' gff文件名
#sed –i 's#rna-##' gff文件名
然后,获取基因与mRNA的对应关系,命令同w.sh文件里的命令,得到的结果如下,出现这种情况怎么办?
基因和转录本还是可以对应上的呀,反而你的蛋白好像不对应 ,不过你的那个怎么是xp_然后显示拟南芥的ID了
这种情况 你需要自己编写程序 根据gff文件的内容把基因的ID于蛋白ID修改一致;
脚本参考:https://www.omicsclass.com/article/566
如果觉得我的回答对您有用,请随意打赏。你的支持将鼓励我继续创作!
您好,我也遇到了这个问题,想请问一下,你的这种问题怎么解决的呢?