ncbi sra数据批量下载

很多项目的数据是多个分组,还有组建重复,因此如果没有批量下载的手段还是挺麻烦,总不能一个个点吧 一般而言有两种常见方法 1 SRA Run Selector直接获取,这个页面链接如下,https://www.nc...

很多项目的数据是多个分组,还有组建重复,因此如果没有批量下载的手段还是挺麻烦,总不能一个个点吧

一般而言有两种常见方法

SRA Run Selector直接获取,这个页面链接如下,https://www.ncbi.nlm.nih.gov/Traces/study/
操作也简单,直接搜索project ID号,就可以了
attachments-2023-08-NdK3Yldw64d48165aad3d.png

然后选择自己想要的直接下载就行

得到的文件直接传给prefetch,类似

prefetch --option-file sra_ids.txt

2,我这边网络不知道咋回事,进刚才那个页面特别慢,因此再分享一个服务器里直接操作的方法,这个需要你服务器里有perl

先下载安装  E-utilities 这个。 网址: https://www.ncbi.nlm.nih.gov/books/NBK179288/

下载安装代码如下

sh -c "$(curl -fsSL https://ftp.ncbi.nlm.nih.gov/entrez/entrezdirect/install-edirect.sh)"
echo "export PATH=\$HOME/edirect:\$PATH" >> $HOME/.bash_profile

执行这两行,软件就会安装到你的家目录,随后找个地方(准备放数据的地方)执行这个代码,注意下面的PRJNA872726改成你自己的,其他可以不要动

esearch -db sra -query "PRJNA872726[bioproject]" | efetch -format runinfo | cut -f 1 -d ',' > sra_ids.txt
随后和刚才一下下载就行
prefetch --option-file sra_ids.txt
  • 发表于 2023-08-10 14:22
  • 阅读 ( 1356 )

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
xun
xun

电路元件工程师

82 篇文章

作家榜 »

  1. omicsgene 700 文章
  2. 安生水 348 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 75 文章
  8. CORNERSTONE 72 文章