6 基因家族分析 处理GFF 文件里面ID不对应,该怎么处理

attachments-2020-08-Q8dRoz0s5f3f863647b42.png按照课程,我查看了一下蛋白质fa文件和GFF3文件,发现了如图中的问题,例如蛋白质fa序列ID是evm.model.supercontig_0.109,对应gff3文件中ID=PAC:16403813;Name=evm.model.supercontig_0.109。有哪位老师知道这个问题该怎么处理?

请先 登录 后评论

1 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

这种情况需要自己编程写脚本处理一下:perl 或者python都可以的:

或者用这个:https://www.omicsclass.com/article/2032  新版基因家族课程已经更新这部分内容:https://bdtcd.xet.tech/s/1BAqPp

请先 登录 后评论
  • 2 关注
  • 0 收藏,4169 浏览
  • Leo 提出于 2020-08-21 16:34

相似问题