答:为保证后续分析的准确性,诺禾致源会严格把控clean data的筛选标准,具体标准如下:
(1) 去除带接头(adapter)的paired reads;
(2) 当单端测序read中含有的N的含量超过该条read长度比例的10%时,需要去除此对paired reads;
(3) 当单端测序read中含有的低质量(Q ≤ 5)碱基数超过该条read长度比例的 50% 时,需要去除此对paired reads。
adapter:接头,用于上机测序。建库时引入的接头序列与测序芯片(flow cell)上固定的接头相互识别。 |
index:测序的标签,用于测定混合样本,通过每个样本添加的不同标签进行数据区分,鉴别测序样品。 |
Q20,Q30:Phred 数值大于20、30的碱基占总体碱基的百分比,其中Phred=-10log10(e),e为错误率。 |
raw data/raw reads:测序下机的原始数据。 |
clean data/clean reads:对原始数据进行过滤后,剔除了低质量数据的剩余数据。后续分析均基于clean data。 二代测序原理及fastq数据详细讲解《illumina测序原理及fastq数据讲解》 |
如果觉得我的回答对您有用,请随意打赏。你的支持将鼓励我继续创作!