NCBI中SRA数据库简介

SRA数据库简介

S R A 数据库，为Sequence Read Archive 的缩写。主要存储高通量测序的数据，来自四个测序平台，分别为： Roche_LS454，Illumina，ABI_SOLID和HELICOS。

SRA 数据库的组织架构

首先是项目编号，通常以PRJ开头，会记录该项目的一些背景信息，包括，研究的目的及意义，项目启动日期，作者单位信息等等，项目下面可以包含以下子内容：

(1)研究内容(study)。 在 SRA 数据库中，研究课题的检索号(accession number)以前缀 DRP， ERP 或S R P 开头。

(2)样本信息(sample)。 样本的检索号以前缀 DRS， ERS 或 SRS开头。样本信息可以包括物种信息、菌株(品系)信息、家系信息、表型数据、临床数据，组织类型等。

(3)实验信息(experiment)。实验的检索号以前缀DRX， ERX 或 SRX 开头。

(4) 数据信息，包括序列及其质量信息等，在 SRA 数据库中以run 为单元存储。 run 的检索号以前缀 DRR， ERR 或SRR 开头。

SRA 数据库进入方法：在NCBI主页找到SRA就可以直接搜索了： https://www.ncbi.nlm.nih.gov/

0 条评论