NCBI 基因组文件下载——datasets

datasets和dataformat是NCBI的命令行(Command line tools)工具,datasets可以下载ncbi上的生物数据,dataformat可以将metadata数据从json格式转化成其他格式类型。 1. 下载工具 curl -o d...

datasets和dataformat是NCBI的命令行(Command line tools)工具,datasets可以下载ncbi上的生物数据,dataformat可以将metadata数据从json格式转化成其他格式类型。


1. 下载工具

curl -o datasets 'https://ftp.ncbi.nlm.nih.gov/pub/datasets/command-line/v2/linux-amd64/datasets'
chmod -R 777 ./datasets


2.利用datasets下载数据

在这里选择了基因组和gff进行下载,下载的文件在GCA_027406505.1.zip里

./datasets download genome accession GCA_027406505.1 --include  genome,gff3 --filename GCA_027406505.1.zip


3. 帮助信息

./datasets --help
Data Retrieval Commands
  summary     Print a data report containing gene, genome or virus metadata
  download    Download a gene, genome or virus dataset as a zip file 下载的结果是:ncbi_dataset.zip
  rehydrate   Rehydrate a downloaded, dehydrated dataset


./datasets download --help
gene        Download a gene data package
genome      Download a genome data package
virus       Download a virus data package

参考:

How-To Guides (nih.gov)

  • 发表于 2024-04-24 16:52
  • 阅读 ( 1584 )
  • 分类:软件工具

0 条评论

请先 登录 后评论
Ti Amo
Ti Amo

48 篇文章

作家榜 »

  1. omicsgene 698 文章
  2. 安生水 347 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 74 文章
  8. CORNERSTONE 72 文章