转录组测序数据量如何选择？ - 组学大讲堂问答社区

我想做个转录组实验，但是不知道应该测多少合适，公司说有有4G、6G、8G之类的是啥意思？怎么衡量测的数据量够不够呢？

所谓的4G、6G是指测序的碱基数，1G就是10亿碱基。

一般来说，测序数据量越大，低表达的基因就越容易被检测到，整体被检测到的基因也就越多了。

数据量的选择，主要考虑物种基因组的大小和复杂程度，再结合实际的研究目的来看。同时也会随着时间的变化而有所改变，2013年时，测序价格很高，很多文章只测了2-4G（普通动植物）就发表了，而现在测序价格大幅度下降，审稿专家们的要求也水涨船高了，一般来说得达到6G。

在实际操作中，也形成了一些约定俗成的固定选择，比如真菌测2-3G、普通动植物测6-8G、大基因组物种测10G或更多。

在做完测序，公司提供的标准分析中，有一张“转录组数据饱和度模拟图”可以衡量数据量测的是否充足。

如上图所示，不同颜色的折线，代表了不同表达量基因随着抽样数据量增加，其被检测到基因数量的上升趋势。一般来说那几条代表高表达基因的折线很快就达到了顶部的话，数据就基本够了（实际意义比较复杂，这里只做简略讲解）。

如果你对手里的转录组分析结果不太懂的话，强烈推荐观察以下教程，看完之后就能够全面的了解自己手里的结果了。

omics007

采纳率 34% | 回答于 2018-09-05 09:53

默认排序时间排序

其它 1 个回答

kuku93 2018-09-05 09:28

转录组测序所需数据量与所研究物种的基因组大小有关，基因组越大，则所需数据量越大。按照我们的经验来说：

常规物种一般建议6G数据即可；

基因组较大的物种推荐8G以上数据，比如：小麦建议10G数据起，甘蔗、甘薯建议至少8G数据。参考：https://www.omicsclass.com/article/295