GATK4它的参数设置中没有多线程的参数并且运行速度较慢,对于大量样品的项目进行变异检测可以每个样品单独进行检测,最后再进行合并。运行命令如下:
1.HaplotypeCaller对单个样品检测。
gatk --java-options "-Xmx50g" HaplotypeCaller --tmp-dir tmp -R genome.ref.fa -ERC GVCF --max-alternate-alleles 4 --sample-ploidy 2 -O 0.g.vcf.gz -I AP1.sort.dedup.bam
2.GenomicsDBImport 对所有样品结果进行合并
gatk --java-options "-Xmx50g" GenomicsDBImport --tmp-dir tmp -R genome.ref.fa --genomicsdb-workspace-path ./db --variant 0.g.vcf.gz --variant 1.g.vcf.gz --variant 2.g.vcf.gz ...
3.GenotypeGVCFs 将GVCF转为VCF
gatk --java-options "-Xmx50g" GenotypeGVCFs --tmp-dir tmp -R genome.ref.fa -O raw.vcf.gz -V gendb://db
此外,我们在网易云课堂上有各种教学视频,有兴趣可以了解一下:
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘
6. 更多学习内容:linux、perl、R语言画图,更多免费课程请点击以下链接:
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!