我看到CDS文件里的ID与基因家族ID不对应,多了前缀和后缀,然后我想询问老师怎么在notepad里批量删除以下的信息
提取序列,不知道你用的是哪个脚本?怎么运行的,输入的文件是什么? 这些都可以截图说明,方便我这里分析原因;
我推测原因:
1.fasta文件,> 后面第一个空格前面的才是序列ID,其他都是序列注释信息,脚本不会读取注释信息;
2.输入的ID列表,要和fasta文件的ID对应一致,才能正确提取成功。
如果觉得我的回答对您有用,请随意打赏。你的支持将鼓励我继续创作!