hmmsearch是针对序列去做的,你查看一下你的序列ID,有可能你的蛋白序列有自己的一套ID类型,能够和gene或者转录本对上即可
一直根据demo脚本运行
后来发现demo里面hmmsearch结果第一列target name跟后面的gene、transcript都能对得上,但是我的hmmsearch结果里面第一列target name跟后面的gene、transcript都不同(gene、transcript之间也不同),导致后续脚本运行下来无法提取对应domain的基因序列等信息,请问应该怎么处理?
是否可以修改脚本select_redundant_mRNA.pl里面某些信息使它提取*_domain_new_out_selected.txt 文件里面transcript一列的内容??
demo步骤如下:
#去除重复的hmmer搜索的转录本ID,多个转录本ID保留一个作为基因的代表,此步建议对脚本输出的文件手动筛选,挑选ID:
perl script/select_redundant_mRNA.pl mRNA2geneID.txt WRKY_domain_new_out_selected.txt WRKY_remove_redundant_IDlist.txt