GATK4

GATK 是 Genome Analysis ToolKit 的缩写,是一款从高通量测序数据中分析变异信息的软件,是目前最主流的snp calling 软件之一。

GATK 是 Genome Analysis ToolKit 的缩写,是一款从高通量测序数据中分析变异信息的软件,是目前最主流的snp calling 软件之一。GATK 设计之初是用于分析人类的全外显子和全基因组数据,随着不断发展,现在也可以用于其他的物种,还支持CNV和SV变异信息的检测。在官网上,提供了完整的分析流程,叫做GATK Best Practices。

1034131-ef93c2ab2c2e9647
目前最新版本文为4.1.2.0, 叫做GATK4。 和之前的版本相比,GATK4在算法上进行了优化,运行速率有所提高,而且整合了picard 软件的功能。GATK4基于java 语言开发的,需要java 1.8 版本。下载链接如下

https://software.broadinstitute.org/gatk/download/

安装过程如下:

wget https://github.com/broadinstitute/gatk/releases/download/4.1.2.0/gatk-4.1.2.0.zip
unzip gatk-4.1.2.0.zip
tree -L 1 gatk-4.1.2.0/
gatk-4.1.2.0/
├── gatk
├── gatk-completion.sh
├── gatkcondaenv.yml
├── GATKConfig.EXAMPLE.properties
├── gatkdoc
├── gatk-package-4.1.2.0-local.jar
├── gatk-package-4.1.2.0-spark.jar
├── gatkPythonPackageArchive.zip
└── README.md

解压缩之后,可以看到两个后缀为.jar的文件,local用于本地运行,spark用于在spark集群上运行。实际使用时,直接用gatk这个可执行文件就行了。

通过一个简单的命令,查看程序是否正确安装

gatk —list

这个命令能够打印出所有的子命令,如果打印出来结果,说明程序安装正确。部分子命令截图如下

1034131-99d47563be8be6de

子命令后面如果有(picard), 说明这个功能是继承于picard软件,从这里也可以看出,GATK4集成了picard软件的功能。再不需要像之前版本一样,混合使用picard 和 gatk 了。



作者:庐州月光
链接:https://www.jianshu.com/p/825e7d618838


此外,我们在网易云课堂上有各种教学视频,有兴趣可以了解一下:

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘

5. 微生物16S/ITS/18S分析原理及结果解读

6. 更多学习内容:linux、perl、R语言画图,更多免费课程请点击以下链接:

https://study.omicsclass.com/

  • 发表于 2019-05-10 09:46
  • 阅读 ( 5003 )
  • 分类:软件工具

0 条评论

请先 登录 后评论
安生水
安生水

347 篇文章

作家榜 »

  1. omicsgene 699 文章
  2. 安生水 347 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 74 文章
  8. CORNERSTONE 72 文章