我在NCBI上下载的CDS数据,在进行提取基因家族的CDS序列时,提取不出来

我看到CDS文件里的ID与基因家族ID不对应,多了前缀和后缀,然后我想询问老师怎么在notepad里批量删除以下的信息

attachments-2019-03-Yrfoc03o5c8750e53fc21.jpg

请先 登录 后评论

1 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

提取序列,不知道你用的是哪个脚本?怎么运行的,输入的文件是什么?  这些都可以截图说明,方便我这里分析原因;


我推测原因:

1.fasta文件,> 后面第一个空格前面的才是序列ID,其他都是序列注释信息,脚本不会读取注释信息;

2.输入的ID列表,要和fasta文件的ID对应一致,才能正确提取成功。

请先 登录 后评论
  • 2 关注
  • 0 收藏,4464 浏览
  • Jenny 提出于 2019-03-12 14:26

相似问题