利用perl脚本去除重复的hmmer搜索的转录本ID，多个转录本ID保留一个作为基因的代表

按照脚本跑完这个指令后我的id list并没有像demo里面那样多个mRNA对应于一个geneID的结果，而是一堆转录本在同一行显示出来了，请问为什么会这样

#去除重复的hmmer搜索的转录本ID，多个转录本ID保留一个作为基因的代表，此步建议对脚本输出的文件手动筛选，挑选ID：

perl script/select_redundant_mRNA.pl mRNA2geneID.txt WRKY_domain_new_out_selected.txt WRKY_remove_redundant_IDlist.txt

以下为demo

以下为我的结果

默认排序时间排序

2 个回答

Doris 2019-07-09 23:00

补充：我的结果里面并不是转录本id 而是蛋白序列id

omicsgene - 生物信息 2019-07-10 17:18

擅长：重测序,遗传进化,转录组,GWAS

你的GFF文件可能不是标准的gff文件，你截图看看；