如果不进行过滤,一些污染的没有比对到基因组的那些片段,会不会造成snp的假阳性,有可能不是我们目标物种的snp? 样品污染可能导致重测序mapping rate 值较低的话,这种数据还可以进行gwas分析吗?发文编辑会不会质疑数据的可靠性?
不用过滤,污染的reads不会比对到参考基因组,不会影响用于call SNP,也就不会影响call SNP的结果;
如果觉得我的回答对您有用,请随意打赏。你的支持将鼓励我继续创作!