生成OTU方法如何选择，OTU/ASV?

微生物多样性分析中最重要的就是OTU特征表，一切后续分析都围绕OTU表来进行。生成OTU除了聚类的方法，还有降噪的方法

扩增子分析视频课程推荐：https://bdtcd.xetslk.com/s/qZRiF

微生物多样性分析中最重要的就是OTU特征表，一切后续分析都围绕OTU表来进行。生成OTU除了聚类的方法，还有降噪的方法。本文分析DADA2、Deblur、Unoise3共三种降噪方法的异同点。

1DADA2

Callahan等人在2016年推出DADA的更新版DADA2，文章发表在Nature Method上。文中对比了DADA2的方法和UPARSE聚类方法的得到OUT的效果（图1），结果表明，DADA2可以识别更多的真实序列，比UPARSE输出更少的伪序列，提高了精确度。

同时文中对孕期女性阴道样本进行分析，用DADA2的方法观察到了Lactobacilluscrispatus菌株水平的差异（图2），而传统的OUT聚类方法则无法观察到。

安装方法：（R包）

source("https://bioconductor.org/biocLite.R")

biocLite("dada2")

2Deblur

Amir等人在16年出的不聚类OUT分析方法，文中作者比较了Deblur与DADA2、UNOISE2的效果。结果表明，与DADA2相似，Deblur同样可以获得稳定的OTUs (图2A)。两种方法得到的序列与NCBI中的nr/nt数据库进行比对，DEblur方法的误配更少，说明DEblur比DADA2更可靠（图B）。Deblur的运算速度比UNIOSE2低一个数量级，却比DADA2 高出一个数量级(图3D)。

且Deblur可以基于单个样品分析，而DADA2和Unoise2只能对混合样本进行分析。

安装方法：（Github）

https://github.com/biocore/deblur

3UNIOSE3

UNIOSE3是UNIOSE2的更新版，UNIOSE2比DADA2的方法更精准，文章中对比了聚类（图4左）和去噪（图4右）两种方法得到OTU的效果。可以看到，左图中，高丰度的序列周围存在很多相近的低丰度序列，大部分是由于PCR和测序过程引入的，而右图中为去噪后的结果。可以看出，去噪的方法会保留更多真实序列，但也有可能留下嵌合体。

安装地址：（32位免费）

http://www.drive5.com/usearch/

总结：

DADA2和Deblur默认去掉singletons，DADA2丢弃的reads相对较少，而Deblur运行速度更快，且可以基于单样本分析；UNOISE3默认保留丰度在8以上的序列，运行速度比Deblur更快。UPARSE得到的是所有正确的生物学序列的子集，每两条序列之间的相似程度在97%以上，但会丢失一些具有意义的生物学序列；而UNOISE3得到的是所有正确的生物学序列，但由于种内差异，对结果亦会造成影响，但要检测单一环境下的菌株，则UNOISE3更有优势。对于是选择聚类还是降噪的方法， Edgar作者本人给出的建议是：最好两种方法都尝试，毕竟没有完美的算法，总会存在一些错误。如果两种方法得出的结论不同，可能两个结果都不可信，需找一下原因；如果结果相同，则更有说服力。具体选择哪种方法还需根据研究内容谨慎考虑。