转录组测序数据fastq统计结果怎么看? 双端测序怎么计算reads数量?

学生最近获得了一种寄生植物的转录组数据,宿主是银杏,测序材料是三片寄生植物叶子(三个重复)。现结果如下:attachments-2018-09-zsckX0Xm5b9876b9d5b9c.jpg

请问老师:

①因为是双末端测序,比如说我要算重复1的总reads大小,是应该把YX-001-1和YX-001-2的reads相加,还是只要算一个就行了?

②我要算本次寄生植物的总reads(重复1+重复2+重复3),是应该把6个测得的reads都相加吗?

③假如在重复1中,双末端测序(YX-001-1和YX-001-2)得到的reads数不一样,是什么原因?是学生采样的问题吗?

请先 登录 后评论

2 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

看你的数据,应该是一个样品取了三个生物学重复(重复1,重复2,重复3),每一个重复里面的(1和2)应该是双端测序得到的read1和read2两个文件的统计结果,因为后面readnumber和bases数量(两个文件如 YX-001_1 和YX-001_2 )是一样的。


1.   YX-001  的bases数可以 YX-001_1 和YX-001_2 相加; read数量你直接用16,054,673就行,说明一下是一对记为1条reads,也可以相加,说按单端计数;

2,所有的read数量也就是测序数据量,你可以相加,文章结果总结可以说一下,一共测了多少read,多少数据量base;

3. 双端测序read1和read2的read数量一定是相等的,不相等说明文件有错误;


更多测序数据说明见:illumina二代测序原理及fastq视频课程》;

请先 登录 后评论
microRNA

从您的描述来看,你是做了3个样本的转录组测序,采用的测序策略是双端测序(Pair End)。

所谓的双端测序,就是一个插入片段,分别从两头测。所以:

1. 两头测序的read1, read2 数量一样。

2. 由于read1, read2 的测序长度一致,所以应该数据量也是一样的

再回到你的3个问题,
1.  样品的总reads:   read1 + read2 
2.  所有的样品总reads :  样品的reads 累加

3. 如果read1, read2 数量不一致: 那就是数据不完整,有可能是测序公司弄错了数据,也有可能是拷贝(传输)数据,导致文件不完整

请先 登录 后评论