很多项目的数据是多个分组,还有组建重复,因此如果没有批量下载的手段还是挺麻烦,总不能一个个点吧
一般而言有两种常见方法
1 SRA Run Selector直接获取,这个页面链接如下,https://www.ncbi.nlm.nih.gov/Traces/study/
操作也简单,直接搜索project ID号,就可以了
然后选择自己想要的直接下载就行
得到的文件直接传给prefetch,类似
prefetch --option-file sra_ids.txt
2,我这边网络不知道咋回事,进刚才那个页面特别慢,因此再分享一个服务器里直接操作的方法,这个需要你服务器里有perl
先下载安装 E-utilities 这个。 网址: https://www.ncbi.nlm.nih.gov/books/NBK179288/
下载安装代码如下
sh -c "$(curl -fsSL https://ftp.ncbi.nlm.nih.gov/entrez/entrezdirect/install-edirect.sh)"
echo "export PATH=\$HOME/edirect:\$PATH" >> $HOME/.bash_profile
esearch -db sra -query "PRJNA872726[bioproject]" | efetch -format runinfo | cut -f 1 -d ',' > sra_ids.txt
prefetch --option-file sra_ids.txt
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!