做科研的,最基本的的实验设计就是设置对照和处理来看一下处理是不是存在差异。但是,是否存在差异不是你说有差异就有差异的,你得拿出证据来,也就是统计学意义上的差异,这时候面对那么多统计学检验方法,我们该怎么选择最适合我们数据的检验方法至关重要了,因为选错了检验方法很可能导致错误的结论!这里我以微生物多样性研究中所涉及到的统计学检验方法给大家总结一下;
微生物多样性测序中的差异分析所针对的“目标”有很多,无论从OTU、alpha多样性指数(如香浓指数)、样本间距离差异(如unifrac)、各水平物种分类(如门纲目科属种)都可以做组间差异分析,从而找到组间差异的重要biomarker。这里总结如下:
非参和有参两种检验方法
选择有参检验方法还是非参检验方法,重要标准就是看我们数据总体分布是否符合正态分布和方差齐性。这个可以使用Shapiro-Wilk test(p>=0.05 正态分布,p<0.05 非正态分布)检验数据是否符合正态分布,用Levene's test检验方差齐性(p>=0.05 方差齐,p<0.05 方差不齐);来决定是用参检验法还是用非参检验方法;
总结一下:
参数检验:即总体分布类型已知,用样本指标对总体参数进行推断或作假设检验的统计检验方法,要求:方差齐性、正态分布。如T检验(两组之间比较差异),ANOVA(多组之间比较分析差异)等
非参数检验:即不考虑总体分布类型是否已知,不比较总体参数,只比较总体分布的位置是否相同的统计方法,要求:总体分布不易确定(即不知道是不是正态分布)分布呈非正态而无适当的数据转换方法等级资料。如Metastats,Wilcoxon rank sum test,Welch’s t-test等(两组之间比较找差异),多组之间比较用(Kruskal-Wallis) 。
一般地,微生物多样性分析中,样本群落分布不确定,多采用非参数检验。
下期详细介绍下基于距离矩阵的差异检验方法。
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程、基因家族文献思路解读
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘、转录组文献解读
5. 微生物16S/ITS/18S分析原理及结果解读、OTU网络图绘制、cytoscape与网络图绘制课程
6. 生物信息入门到精通必修基础课:linux系统使用、biolinux搭建生物信息分析环境、linux命令处理生物大数据、perl入门到精通、perl语言高级、R语言画图、R语言快速入门与提高
7. 医学相关数据挖掘课程,不用做实验也能发文章:TCGA-差异基因分析、GEO芯片数据挖掘、 GEO芯片数据不同平台标准化 、GSEA富集分析课程、TCGA临床数据生存分析、TCGA-转录因子分析、TCGA-ceRNA调控网络分析
8.其他,二代测序转录组数据自主分析、NCBI数据上传、二代fastq测序数据解读、
课程推荐:微生物扩增子分析课程实操 微生物16S/ITS/18S分析原理及结果解读
延伸阅读
CoNet 网络图绘制|lefse差异分析|微生物测序原理|肠道君|什么是OTU|alpha多样性|Beta多样性|GraPhlAn树状图|OTU网络图MENA
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!