qiime2分类器的训练

训练分类器 Training classifier 因为不同实验的扩增区域不同,鉴定物种分类的精度不同,提前的训练可以让分类结果更准确。在本教程中,使用到的是已经训练好细菌V4区的分类器,可在QIIME2官网...

训练分类器 Training classifier

因为不同实验的扩增区域不同,鉴定物种分类的精度不同,提前的训练可以让分类结果更准确。在本教程中,使用到的是已经训练好细菌V4区的分类器,可在QIIME2官网下载        https://docs.qiime2.org/2022.8/data-resources/

方法注释在训练分类器之前,我们要弄清楚三点:1.选择合适的数据库;2.扩增引物;3测序序列长度分布(此步骤可选择使用)。

在本教程中,使用的16s rRNA 扩增子数据,引物为515f-806r,选用greengenes数据库进行比对。

提取扩增区命令:



  1. qiime feature-classifier extract-reads
  2. --i-sequences 99_otus.qza
  3. --p-f-primer ACTCCTACGGGAGGCAGCAG
  4. --p-r-primer GGACTACHVGGGTWTCTAAT
  5. --p-n-jobs 4
  6. --o-reads ref-seqs.qza

仅保留细菌的代表序列命令:



  1. qiime taxa filter-seqs
  2. --i-sequences ref-seqs.qza
  3. --i-taxonomy 99_otu_taxonomy.qza
  4. --p-include Bacteria
  5. --o-filtered-sequences ref-seqs-Bacteria.qza

仅保留细菌的注释信息命令:



  1. qiime rescript filter-taxa
  2. --i-taxonomy 99_otu_taxonomy.qza
  3. --m-ids-to-keep-file ref-seqs-Bacteria.qza
  4. --o-filtered-taxonomy ref-seqs-Bacteria-tax.qza

训练分类器命令:



  1. qiime feature-classifier fit-classifier-naive-bayes
  2. --i-reference-reads ref-seqs-Bacteria.qza
  3. --i-reference-taxonomy ref-seqs-Bacteria-tax.qza
  4. --o-classifier classifier-Bacteria.qza

  • 发表于 2022-11-14 15:26
  • 阅读 ( 2285 )
  • 分类:宏基因组

0 条评论

请先 登录 后评论
xun
xun

电路元件工程师

82 篇文章

作家榜 »

  1. omicsgene 700 文章
  2. 安生水 348 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 75 文章
  8. CORNERSTONE 72 文章