5 生成MCScanX的gff文件时发现蛋白序列id是cds序列的id,请问怎么转成mRNA或者geneID

请先 登录 后评论

4 个回答

兰天

gff文件中Name后面的名称就是基因名称,你的截图不完整。


python -m jcvi.formats.fasta format --sep="/"  XX_cds.fa.gz xx.cds


请先 登录 后评论
ljl6528

attachments-2019-06-bOz1c0YR5cf7a235ba0a7.jpgattachments-2019-06-pYRCQWPc5cf7a2698ebdc.jpg

请先 登录 后评论
Daitoue

不太清楚你实际取用的ID是什么,但是gff文件中是会提供geneID和转录本ID之间的对应关系的,而每个CDS也是有所属的parent mRNA的 这个是能够对应上的


请先 登录 后评论
omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

看看你的cds序列中的ID是否在gff中能搜索到?如果能搜索到,你需要编写脚本把对应的ID关系批量的提取出来;

建议学习perl语言可以完成: perl入门到精通perl语言高级


如果自己没有编程基础,无法处理,建议不要在NCBI上下载参考基因组,其他enseml 或者JGI等数据库下载参考基因组;

请先 登录 后评论
  • 4 关注
  • 0 收藏,3798 浏览
  • ljl6528 提出于 2019-06-05 19:03

相似问题