使用bcftools文件提取vcf文件子集

1. 准备好要提取的染色体及位置信息文件id.list。文件示例如下: Chr1    11787600        11793521Chr1    30028805        30042382Chr1    54966087        54970283Chr1    57228272     ...

1. 准备好要提取的染色体及位置信息文件id.list。文件示例如下:

Chr1    11787600        11793521
Chr1    30028805        30042382
Chr1    54966087        54970283
Chr1    57228272        57231222
或者指定具体位点
Chr1    11787600
Chr1    30028805
Chr1    54966087
Chr1    57228272
2. 要处理的vcf文件(snp/indel)。注意bcftools处理的vcf文件要用gbzip压缩并构建索引才行。snp.vcf文件示例如下:

attachments-2024-03-HUFP19NP65eed891bec2a.png

3. 处理命令:

bgzip snp.vcf    #压缩
tabix -p vcf snp.vcf.gz    #建索引
bcftools view -R id.list snp.vcf.gz  >snp.pos.vcf    #提取子集
4. 最后就会得到想要(基因)位置的snp/indel信息




  • 发表于 2024-03-11 18:13
  • 阅读 ( 3478 )
  • 分类:软件工具

0 条评论

请先 登录 后评论
rzx
rzx

76 篇文章

作家榜 »

  1. omicsgene 702 文章
  2. 安生水 350 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 76 文章
  8. CORNERSTONE 72 文章