利用perl脚本去除重复的hmmer搜索的转录本ID,多个转录本ID保留一个作为基因的代表

按照脚本跑完这个指令后我的id list并没有像demo里面那样多个mRNA对应于一个geneID的结果,而是一堆转录本在同一行显示出来了,请问为什么会这样


#去除重复的hmmer搜索的转录本ID,多个转录本ID保留一个作为基因的代表,此步建议对脚本输出的文件手动筛选,挑选ID:

perl script/select_redundant_mRNA.pl mRNA2geneID.txt WRKY_domain_new_out_selected.txt WRKY_remove_redundant_IDlist.txt


以下为demo

attachments-2019-07-sOKQ3gGe5d24aa6470ce6.jpg

以下为我的结果

attachments-2019-07-DUXJpaWZ5d24a9a563fcf.jpgattachments-2019-07-DUXJpaWZ5d24a9a563fcf.jpgattachments-2019-07-DUXJpaWZ5d24a9a563fcf.jpg


请先 登录 后评论

2 个回答

Doris

补充:我的结果里面并不是转录本id 而是蛋白序列id

请先 登录 后评论
omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

你的GFF文件可能不是标准的gff文件,你截图看看;

类似问题:https://www.omicsclass.com/article/816

请先 登录 后评论