补充:我的结果里面并不是转录本id 而是蛋白序列id
按照脚本跑完这个指令后我的id list并没有像demo里面那样多个mRNA对应于一个geneID的结果,而是一堆转录本在同一行显示出来了,请问为什么会这样
#去除重复的hmmer搜索的转录本ID,多个转录本ID保留一个作为基因的代表,此步建议对脚本输出的文件手动筛选,挑选ID:
perl script/select_redundant_mRNA.pl mRNA2geneID.txt WRKY_domain_new_out_selected.txt WRKY_remove_redundant_IDlist.txt
以下为demo
以下为我的结果