ncbi sra数据批量下载

很多项目的数据是多个分组，还有组建重复，因此如果没有批量下载的手段还是挺麻烦，总不能一个个点吧一般而言有两种常见方法 1 SRA Run Selector直接获取，这个页面链接如下，https://www.nc...

很多项目的数据是多个分组，还有组建重复，因此如果没有批量下载的手段还是挺麻烦，总不能一个个点吧

一般而言有两种常见方法

1 SRA Run Selector直接获取，这个页面链接如下，https://www.ncbi.nlm.nih.gov/Traces/study/
操作也简单，直接搜索project ID号，就可以了

然后选择自己想要的直接下载就行

得到的文件直接传给prefetch，类似

prefetch --option-file sra_ids.txt

2，我这边网络不知道咋回事，进刚才那个页面特别慢，因此再分享一个服务器里直接操作的方法，这个需要你服务器里有perl

先下载安装 E-utilities 这个。网址： https://www.ncbi.nlm.nih.gov/books/NBK179288/

下载安装代码如下

sh -c "$(curl -fsSL https://ftp.ncbi.nlm.nih.gov/entrez/entrezdirect/install-edirect.sh)"

echo "export PATH=\$HOME/edirect:\$PATH" >> $HOME/.bash_profile

执行这两行，软件就会安装到你的家目录，随后找个地方（准备放数据的地方）执行这个代码，注意下面的PRJNA872726，改成你自己的，其他可以不要动

esearch -db sra -query "PRJNA872726[bioproject]" | efetch -format runinfo | cut -f 1 -d ',' > sra_ids.txt

随后和刚才一下下载就行

prefetch --option-file sra_ids.txt

0 条评论