我在NCBI上下载的CDS数据，在进行提取基因家族的CDS序列时，提取不出来

我看到CDS文件里的ID与基因家族ID不对应，多了前缀和后缀，然后我想询问老师怎么在notepad里批量删除以下的信息

默认排序时间排序

1 个回答

omicsgene - 生物信息 2019-03-12 17:08

擅长：重测序,遗传进化,转录组,GWAS

提取序列，不知道你用的是哪个脚本？怎么运行的，输入的文件是什么？这些都可以截图说明，方便我这里分析原因；

我推测原因：

1.fasta文件，> 后面第一个空格前面的才是序列ID，其他都是序列注释信息，脚本不会读取注释信息；

2.输入的ID列表，要和fasta文件的ID对应一致，才能正确提取成功。