一般物种的基因组序列、注释文件gtf、CDS序列、蛋白序列都可以同时下载到。
但是有些物种基因组复杂,未能组装到染色体水平,只是组装到一些scaffolds,而且不能下载全基因组蛋白序列。请问,怎样根据注释信息获取这些物种的全基因组蛋白序列呢?拜托各位指导一下。
组装之后的基因组,肯定有蛋白质序列和cds序列,你再找找吧。
不然你需要写程序根据gff注释信息从基因组截取cds序列,再翻译出蛋白质;
如果觉得我的回答对您有用,请随意打赏。你的支持将鼓励我继续创作!