vcftools计算snp缺失率

vcftools计算snp缺失率

vcftools中有两个参数可以计算vcf文件中snp的缺失率。

分别是:

--missing-indv     生成一个文件,报告每个样品的缺失情况,该文件的后缀为“.imiss”。

--missing-site      生成一个文件,报告每个snp位点的缺失情况,该文件的后缀为“.lmiss”。



具体用法:

vcftools --vcf  snp.vcf.   --missing-site 

运行以上命令后会在当前目录生成一个 out.lmiss 文件,其格式如下:

CHR     POS     N_DATA  N_GENOTYPE_FILTERED     N_MISS  F_MISS
chr01   194921  988     0       368     0.37247
chr01   384714  988     0       204     0.206478
chr01   384719  988     0       202     0.204453
chr01   518438  988     0       488     0.493927
chr01   518473  988     0       452     0.45749
chr01   518579  988     0       418     0.423077
chr01   518635  988     0       428     0.433198
chr01   680786  988     0       346     0.350202
chr01   680834  988     0       412     0.417004
前两列为snp所在位置,第三列为等位基因总数,第5列为缺失的总数,最后一列为缺失率。


vcftools --vcf  snp.vcf.   --missing-indv

运行以上命令后会在当前目录生成一个 out.imiss 文件,其格式如下:

INDV    N_DATA  N_GENOTYPES_FILTERED    N_MISS  F_MISS
1       8747    0       3632    0.415228
10      8747    0       1264    0.144507
102     8747    0       2016    0.230479
105     8747    0       6322    0.722762
106     8747    0       2365    0.270378
107     8747    0       4376    0.500286
108     8747    0       5682    0.649594
109     8747    0       1877    0.214588
11      8747    0       1039    0.118784
第一列为样品名称,第二列为总的snp数,第4列为缺失的总数,最后一列为缺失率。


  • 发表于 2018-12-21 12:48
  • 阅读 ( 7993 )
  • 分类:软件工具

0 条评论

请先 登录 后评论
安生水
安生水

351 篇文章

作家榜 »

  1. omicsgene 702 文章
  2. 安生水 351 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. rzx 78 文章
  7. 红橙子 78 文章
  8. CORNERSTONE 72 文章