NCBI高通量测序数据SRA数据库下载新方法

SRA数据下载方法

NCBI下载SRA数据

从NCBI下载数据本来是一件很简单的事情,但是今天碰到几个坑:

1、paper里没有提供SRA数据号、也没有提供路径;

2、不知道文件在ftp的地址,不能直接用wget下载

 

所以通过在NCBI官网,直接在SRA搜索栏里输入paper的title关键词NIFTY BGI

attachments-2019-07-5zVFTeXM5d28012f98435.jpg

搜索结果:

 attachments-2019-07-D1RTqSA45d28014b7e1be.jpg

选一个文件点击进去

attachments-2019-07-52LcPiBi5d28015fc0ec6.jpg

 进去之后,再点击SRP

attachments-2019-07-whtPfgxx5d280188d8877.jpg

然后:

attachments-2019-07-74TCK4zy5d2801b28434a.jpg

出现如下内容:

attachments-2019-07-Z6C2Pnvg5d28021092383.jpg

然后选择所有SRR文件:

attachments-2019-07-GN7cTFgV5d28020498ccf.jpg

下载Accession list之后得到文件列表:
















SRR354208
SRR357358
SRR357397
SRR357398
SRR357666
SRR357667
SRR357668
SRR357669
SRR357670
SRR357671
SRR357672
SRR357673
SRR357674
SRR357675
SRR357676

然后根据这个列表在linux下载:

[wuzengding@mn01 NIFTY_BGI_samp]$ cat /data1/Medicine/WZD/SRR_Acc_List.txt | while read line
> do
> echo $line
> /home/wuzengding/biosoftware/sratoolkit.2.8.2-1-centos_linux64/bin/fastq-dump.2.8.2 ${line}
> done

 

注:另外一种更简单方法

在找到这个界面时

attachments-2019-07-CH0IIVC85d2802aa81214.jpg

点击send to

attachments-2019-07-ZfbQHQiV5d2802bd6b58a.jpg

 最后得到SraRunInfo.csv文件,文件内容是各个samp sequence的列表信息,包括FTP上的下载地址:

attachments-2019-07-d3QkAJDq5d2802dcd71b8.jpg

然后在linux中下载,

完毕!



此外,我们在网易云课堂上有各种教学视频,有兴趣可以了解一下:

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘

5. 微生物16S/ITS/18S分析原理及结果解读

6. 更多学习内容:linux、perl、R语言画图,更多免费课程请点击以下链接:

https://study.omicsclass.com/


  • 发表于 2019-07-12 11:39
  • 阅读 ( 4728 )
  • 分类:软件工具

0 条评论

请先 登录 后评论
安生水
安生水

347 篇文章

作家榜 »

  1. omicsgene 698 文章
  2. 安生水 347 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 74 文章
  8. CORNERSTONE 72 文章