生成MCScanX的gff文件时发现蛋白序列id是cds序列的id，请问怎么转成mRNA或者geneID

回答问题即可获得 10 经验值，回答被采纳后即可获得 10 金币。

默认排序时间排序

4 个回答

兰天 2019-06-14 11:47

gff文件中Name后面的名称就是基因名称，你的截图不完整。

python -m jcvi.formats.fasta format --sep="/"  XX_cds.fa.gz xx.cds

ljl6528 2019-06-05 19:07

Daitoue 2019-06-06 09:09

不太清楚你实际取用的ID是什么，但是gff文件中是会提供geneID和转录本ID之间的对应关系的，而每个CDS也是有所属的parent mRNA的这个是能够对应上的

omicsgene - 生物信息 2019-06-06 10:57

擅长：重测序,遗传进化,转录组,GWAS

看看你的cds序列中的ID是否在gff中能搜索到？如果能搜索到，你需要编写脚本把对应的ID关系批量的提取出来；

建议学习perl语言可以完成： perl入门到精通、perl语言高级

如果自己没有编程基础，无法处理，建议不要在NCBI上下载参考基因组，其他enseml 或者JGI等数据库下载参考基因组；