15 get_gtf.pl 脚本修改请教

老师由于我是ncbi上下载的gff文件  格式与ensemble上的有差别 我想提取这段基因的内外含子结构但get_gtf.pl      提不出来

这是gff文件第九列信息样子

ID=cds39033;Parent=rna44550;Dbxref=GeneID:105319604,Genbank:XP_011415503.1;Name=XP_011415503.1;gbkey=CDS;gene=LOC105319604;product=neprilysin;protein_id=XP_011415503.1

查询所用的id号是 XP_011415503.1 我用的是网上课程附带的脚本


请先 登录 后评论

最佳答案 2018-12-11 11:00

尽量不要在NCBI上下载参考基因组,里面的编号NCBI会重新编码,你看看你物种参考基因组的文章,一般发布了基因组都会建立物种专有的基因组网站,你对应自己的物种去专用网站下载;

如果一定要用,可参考这个脚本将GFF文件修改一下,在网下进行分析:https://www.omicsclass.com/article/566

你的ID号和CDS的ID好不对应,所有提取不出来。


请先 登录 后评论

其它 0 个回答

  • 1 关注
  • 0 收藏,2641 浏览
  • 陈塘关山渣 提出于 2018-12-06 09:35

相似问题