我的hmmsearch结果第一列（target neme）不是geneid 也不是转录本id

一直根据demo脚本运行

后来发现demo里面hmmsearch结果第一列target name跟后面的gene、transcript都能对得上，但是我的hmmsearch结果里面第一列target name跟后面的gene、transcript都不同（gene、transcript之间也不同），导致后续脚本运行下来无法提取对应domain的基因序列等信息，请问应该怎么处理？

是否可以修改脚本select_redundant_mRNA.pl里面某些信息使它提取*_domain_new_out_selected.txt 文件里面transcript一列的内容？？

demo步骤如下：

#去除重复的hmmer搜索的转录本ID，多个转录本ID保留一个作为基因的代表，此步建议对脚本输出的文件手动筛选，挑选ID：

perl script/select_redundant_mRNA.pl mRNA2geneID.txt WRKY_domain_new_out_selected.txt WRKY_remove_redundant_IDlist.txt

0 条评论
分类：基因家族分析

默认排序时间排序

1 个回答

Daitoue 2019-07-10 09:20

hmmsearch是针对序列去做的，你查看一下你的序列ID，有可能你的蛋白序列有自己的一套ID类型，能够和gene或者转录本对上即可

我的hmmsearch结果第一列（target neme）不是geneid 也不是转录本id

1 个回答

相似问题