关于RNAseq的docker分析中获取基因长度报错问题

老师,您好,我在学习您的课程(RNAseq自主分析)中,使用docker分析转录组获取全长时候总是出现报错,命令行为,python ../scripts/get_gene_length_from_gtf.py -g genome.gtf -p gene_length;报错信息为:

Traceback (most recent call last):
  File "../scripts/get_gene_length_from_gtf.py", line 51, in <module>
    if kvs['gene_id'] in geneL and kvs['transcript_id'] in geneL[kvs['gene_id']]:
KeyError: 'gene_id'
gtf如下:
attachments-2022-04-EkEiHA5s626216ee520fc.png请教老师如何解决这个问题,不胜感激!
请先 登录 后评论

2 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

GTF 文件不标准,有些行缺少gene_id  

可能是非编码的基因,可以删除这些行,再重新运行代码:

attachments-2022-04-8llGwiY4626223c07e55e.png

请先 登录 后评论
微信用户

老师,您好,我看了一下gff文件,里面有gene注释信息,好像和文章中的问题不一样,您能再看下吗,谢谢!

attachments-2022-04-cXB5uumA62621aace7265.png

请先 登录 后评论
  • 2 关注
  • 0 收藏,1768 浏览
  • 微信用户 提出于 2022-04-22 10:47

相似问题