GenotypeGVCFs 运行速度慢解决方法

GenotypeGVCFs 运行速度慢解决方法

由于GATK4的 GenotypeGVCFs 没了设置多线程的参数,直接使用来转换格式的话会非常慢,为了提高效率,可以拆分染色体分别转换为vcf格式,之后使用MergeVcfs 合并所有染色体,命令如下:


#多条染色体并行运行
gatk GenotypeGVCFs -L Chr01 -R genome.final.fa -O Chr01.raw.vcf.gz -V gendb://db
#由于上一步使用了 GenomicsDBImport 合并GVCF,故-V参数使用了gendb://db;-L参数可以直接指定染色体名称,也可以是包含染色体列表的文件
#对vcf进行合并
ls *.raw.vcf.gz > all_genotype.list
gatk MergeVcfs -I all_genotype.list -O raw.vcf.gz

这样处理可以极大加快GenotypeGVCFs 的速度。

  • 发表于 2023-02-07 11:44
  • 阅读 ( 2382 )
  • 分类:软件工具

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
安生水
安生水

350 篇文章

作家榜 »

  1. omicsgene 702 文章
  2. 安生水 350 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 76 文章
  8. CORNERSTONE 72 文章