datasets和dataformat是NCBI的命令行(Command line tools)工具,datasets可以下载ncbi上的生物数据,dataformat可以将metadata数据从json格式转化成其他格式类型。
1. 下载工具
curl -o datasets 'https://ftp.ncbi.nlm.nih.gov/pub/datasets/command-line/v2/linux-amd64/datasets'
chmod -R 777 ./datasets
2.利用datasets下载数据
在这里选择了基因组和gff进行下载,下载的文件在GCA_027406505.1.zip里
./datasets download genome accession GCA_027406505.1 --include genome,gff3 --filename GCA_027406505.1.zip
3. 帮助信息
./datasets --help
Data Retrieval Commands
summary Print a data report containing gene, genome or virus metadata
download Download a gene, genome or virus dataset as a zip file 下载的结果是:ncbi_dataset.zip
rehydrate Rehydrate a downloaded, dehydrated dataset
./datasets download --help
gene Download a gene data package
genome Download a genome data package
virus Download a virus data package
参考:
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!