100 如何提取一个冷门物种(NCBI下载)的CDS序列

在NCBI上下载了一个冷门物种(芦笋)的GFF文件和CDS文件(如图1所示),但是这个CDS文件中的注释让我比较恼火,GFF文件中的任意识别ID(除了GeneID)都无法对应CDS文件中某个识别ID(如图2,包括transcript_ID,Protein_ID)那我如何提取某个基因的代表性CDS序列呢?

为了查看方便已将相关文件上传到百度网盘中供查看:链接:https://pan.baidu.com/s/1Zan0B4Ltn65vfSmjMJLu1Q 提取码:6455!!!太恼火了!

attachments-2020-04-IwfvNOA05e96827c200d6.png

图1

attachments-2020-04-aT4YoB1t5e96836ea980a.png图2

请先 登录 后评论

最佳答案 2020-04-15 16:16

可以看看这个问题,里面有些代码,你可以试试:

https://www.omicsclass.com/question/584


建议学习perl:

perl入门到精通perl语言高级


请先 登录 后评论

其它 0 个回答

  • 1 关注
  • 0 收藏,5085 浏览
  • 苏麟-WSL 提出于 2020-04-15 11:51

相似问题