一般来说,测序仪下机的数据称为raw data,经过以下两步处理之后变成了clean data才能用于数据分析:
(1) 去除含有接头的Reads;
(2) 去除低质量的Reads(包括去除N的比例大于10%的Reads;去除质量值Q≤10的碱基数占整条Read的50%以上的Reads)
不过raw data和clean data并没有一个权威的定义,不同的文章和公司可能会提供不一样的解释,不变的是:clean data是raw data经过处理得到的直接用来分析的数据。
如果需要看懂公司提供的转录组分析结果,建议观看教程:转录组分析结果的解读(适合有参)或者转录组分析结果的解读(适合无参),如果想自己在公司提供标准分析的基础上做些个性化分析,可以观看:转录组标准分析后的数据挖掘,以及转录组高级分析WGCNA:WGCNA-加权基因共表达网络分析。