老师您好,我按照课程,gatk VariantFiltration 过滤,这一步跑了1个月才跑完,all.raw.vcf.gz文件58G,跑完生成的 all.raw.gatked.vcf.gz文件大小只有13G,最后的all.clean.indel.vcf.gz 和 all.clean.snp.vcf.gz大小分别只有6、14M,请教老师这正常吗?
这个我不知道你的测序深度,还有物种基因组大小,还有你过滤的参数;不好评估SNP数量上的多少是否合理。
建议多尝试过滤参数,在质量和数量上取一个平衡;符合自己的预期即可;
如果觉得我的回答对您有用,请随意打赏。你的支持将鼓励我继续创作!