请问老师,用比对后的bam文件进行call snp,bam文件中储存了比对的信息。假如样本mapping rate 值比较低在70左右,那么后续call snp的时候,需要把没有比对到基因组的reads提取出来过滤掉吗?还是说生成的bam文件储存的就是比对到基因组的这些序列?

如果不进行过滤,一些污染的没有比对到基因组的那些片段,会不会造成snp的假阳性,有可能不是我们目标物种的snp? 样品污染可能导致重测序mapping rate 值较低的话,这种数据还可以进行gwas分析吗?发文编辑会不会质疑数据的可靠性?

请先 登录 后评论

1 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

不用过滤,污染的reads不会比对到参考基因组,不会影响用于call SNP,也就不会影响call SNP的结果;


请先 登录 后评论
  • 1 关注
  • 0 收藏,1201 浏览
  • shidandan 提出于 2023-10-09 16:24

相似问题