训练分类器 Training classifier
因为不同实验的扩增区域不同,鉴定物种分类的精度不同,提前的训练可以让分类结果更准确。在本教程中,使用到的是已经训练好细菌V4区的分类器,可在QIIME2官网...
训练分类器 Training classifier
因为不同实验的扩增区域不同,鉴定物种分类的精度不同,提前的训练可以让分类结果更准确。在本教程中,使用到的是已经训练好细菌V4区的分类器,可在QIIME2官网下载 https://docs.qiime2.org/2022.8/data-resources/
方法注释在训练分类器之前,我们要弄清楚三点:1.选择合适的数据库;2.扩增引物;3测序序列长度分布(此步骤可选择使用)。
在本教程中,使用的16s rRNA 扩增子数据,引物为515f-806r,选用greengenes数据库进行比对。
提取扩增区命令:
qiime feature-classifier extract-reads
--i-sequences 99_otus.qza
--p-f-primer ACTCCTACGGGAGGCAGCAG
--p-r-primer GGACTACHVGGGTWTCTAAT
仅保留细菌的代表序列命令:
--i-sequences ref-seqs.qza
--i-taxonomy 99_otu_taxonomy.qza
--o-filtered-sequences ref-seqs-Bacteria.qza
仅保留细菌的注释信息命令:
qiime rescript filter-taxa
--i-taxonomy 99_otu_taxonomy.qza
--m-ids-to-keep-file ref-seqs-Bacteria.qza
--o-filtered-taxonomy ref-seqs-Bacteria-tax.qza
训练分类器命令:
qiime feature-classifier fit-classifier-naive-bayes
--i-reference-reads ref-seqs-Bacteria.qza
--i-reference-taxonomy ref-seqs-Bacteria-tax.qza
--o-classifier classifier-Bacteria.qza