S R A 数据库, 为Sequence Read Archive 的缩写。主要存储高通量测序的数据,来自四个测序平台,分别为: Roche_LS454,Illumina,ABI_SOLID和HELICOS。
SRA 数据库的组织架构
首先是项目编号,通常以PRJ开头,会记录该项目的一些背景信息,包括,研究的目的及意义,项目启动日期,作者单位信息等等,项目下面可以包含以下子内容:
(1)研究内容(study)。 在 SRA 数据库中, 研究课题的检索号(accession number)以前缀 DRP, ERP 或S R P 开头。
(2)样本信息(sample)。 样本的检索号以前缀 DRS, ERS 或 SRS开头。 样本信息可以包括物种信息、 菌株(品系)信息、 家系信息、 表型数据、 临床数据, 组织类型等。
(3)实验信息(experiment)。实验的检索号以前缀DRX, ERX 或 SRX 开头。
(4) 数据信息,包括序列及其质量信息等, 在 SRA 数据库中以run 为单元存储。 run 的检索号以前缀 DRR, ERR 或SRR 开头。
SRA 数据库进入方法:在NCBI主页找到SRA就可以直接搜索了: https://www.ncbi.nlm.nih.gov/
更多SRA数据下载: https://www.omicsclass.com/article/53
高通量fastq测序数据查看: https://www.omicsclass.com/question/42
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!