我的hmmsearch结果第一列(target neme)不是geneid 也不是转录本id

一直根据demo脚本运行

后来发现demo里面hmmsearch结果第一列target name跟后面的gene、transcript都能对得上,但是我的hmmsearch结果里面第一列target name跟后面的gene、transcript都不同(gene、transcript之间也不同),导致后续脚本运行下来无法提取对应domain的基因序列等信息,请问应该怎么处理?

是否可以修改脚本select_redundant_mRNA.pl里面某些信息使它提取*_domain_new_out_selected.txt  文件里面transcript一列的内容??


demo步骤如下:

#去除重复的hmmer搜索的转录本ID,多个转录本ID保留一个作为基因的代表,此步建议对脚本输出的文件手动筛选,挑选ID:

perl script/select_redundant_mRNA.pl mRNA2geneID.txt WRKY_domain_new_out_selected.txt WRKY_remove_redundant_IDlist.txt

请先 登录 后评论

1 个回答

Daitoue

hmmsearch是针对序列去做的,你查看一下你的序列ID,有可能你的蛋白序列有自己的一套ID类型,能够和gene或者转录本对上即可

请先 登录 后评论
  • 1 关注
  • 0 收藏,2813 浏览
  • Doris 提出于 2019-07-09 23:42

相似问题