在NCBI上下载了一个冷门物种(芦笋)的GFF文件和CDS文件(如图1所示),但是这个CDS文件中的注释让我比较恼火,GFF文件中的任意识别ID(除了GeneID)都无法对应CDS文件中某个识别ID(如图2,包括transcript_ID,Protein_ID)那我如何提取某个基因的代表性CDS序列呢?
为了查看方便已将相关文件上传到百度网盘中供查看:链接:https://pan.baidu.com/s/1Zan0B4Ltn65vfSmjMJLu1Q 提取码:6455!!!太恼火了!
图1
图2