利用qiime2对微生物扩增子测序数据文库根据barcode信息拆分数据

Demultiplexing and Trimming Adapters from Reads with q2-cutadapt

首先准备sample-metadata.tsv文件,样本的barcode 文件信息,这里以双端测序为例:

sample-id       forward-barcodes        reverse-barcodes
Lin027  GATCTGCA        CTACGATG
Lin028  GATCTGCA        GACATAGC
Lin029  GATCTGCA        GATCTGCA
Lin032  GATCTGCA        GCGTATGA
Lin033  GATCTGCA        GTATGCGA

准备测序数据,没有拆分的双端数据放到一个目录:muxed-pe-barcode-in-seq,分别命名为:forward.fastq.gz   reverse.fastq.gzattachments-2020-12-4DQzXAv25fe2b3d87daa9.png
数据导入:
qiime tools import   --type MultiplexedPairedEndBarcodeInSequence   \
    --input-path muxed-pe-barcode-in-seq   \
    --output-path multiplexed-seqs.qza

利用qiime cutadapt 插件拆分数据:

qiime cutadapt demux-paired --i-seqs multiplexed-seqs.qza \
    --m-forward-barcodes-file sample-metadata.tsv \ --m-forward-barcodes-column forward-barcodes \
    --m-reverse-barcodes-file sample-metadata.tsv \ --m-reverse-barcodes-column reverse-barcodes \
    --o-per-sample-sequences per_sample_sequences.qza \ --o-untrimmed-sequences untrimmed_sequences.qza

per_sample_sequences.qza  这个文件是拆分好的数据,并且已经去掉了barcode序列。

如果想去除引物可以使用:
    qiime cutadapt trim-paired \
        --i-demultiplexed-sequences per_sample_sequences.qza \
        --p-cores 4 \
        --p-no-indels \
        --p-front-f ACTCCTACGGGAGGCAGCAG \
        --p-front-r GGACTACHVGGGTWTCTAAT  \
        --o-trimmed-sequences primer-trimmed-demux.qza 






参考:https://forum.qiime2.org/t/demultiplexing-and-trimming-adapters-from-reads-with-q2-cutadapt/2313



  • 发表于 2020-12-23 11:09
  • 阅读 ( 8411 )
  • 分类:宏基因组

0 条评论

请先 登录 后评论
omicsgene
omicsgene

生物信息

698 篇文章

作家榜 »

  1. omicsgene 698 文章
  2. 安生水 347 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 74 文章
  8. CORNERSTONE 72 文章