NCBI自带的Batch Entrez工具可以根据基因/蛋白id在数据库中批量检索和下载基因/蛋白序列,首先进入网站:
https://www.ncbi.nlm.nih.gov/sites/batchentrez
准备一个包含全部基因/蛋白编号的文本文件(ID.txt),格式如下:
点击选择文件,选择ID.txt文本文件,database类型选择Protein(如果下载的是基因序列选择Nucleotide):
点击Retrieve,进入如下页面:
点击Retrieve records for XX UID(s),进入搜索结果页面,点击send to,选择输出为fasta格式文件,下载:
这样我们就获得了想要下载的全部蛋白序列:
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!