老师由于我是ncbi上下载的gff文件 格式与ensemble上的有差别 我想提取这段基因的内外含子结构但get_gtf.pl 提不出来
这是gff文件第九列信息样子
ID=cds39033;Parent=rna44550;Dbxref=GeneID:105319604,Genbank:XP_011415503.1;Name=XP_011415503.1;gbkey=CDS;gene=LOC105319604;product=neprilysin;protein_id=XP_011415503.1
查询所用的id号是 XP_011415503.1 我用的是网上课程附带的脚本
尽量不要在NCBI上下载参考基因组,里面的编号NCBI会重新编码,你看看你物种参考基因组的文章,一般发布了基因组都会建立物种专有的基因组网站,你对应自己的物种去专用网站下载;
如果一定要用,可参考这个脚本将GFF文件修改一下,在网下进行分析:https://www.omicsclass.com/article/566
你的ID号和CDS的ID好不对应,所有提取不出来。
如果觉得我的回答对您有用,请随意打赏。你的支持将鼓励我继续创作!