在实验研究过程中,实验数据常会产生batch effect,而批次效应的来源可能和生物或者科学变量没有任何关系,当处理不当,会对结果产生影响,产生假阳性或者假阴性
####################################################
http://genomicsclass.github.io/book/pages/intro_to_batch_effects.html
One often overlooked complication with high-throughput studies is batch effects, which occur because measurements are affected by laboratory conditions, reagent lots, and personnel differences. This becomes a major problem when batch effects are confounded with an outcome of interest and lead to incorrect conclusions. In this chapter, we describe batch effects in detail: how to detect, interpret, model, and adjust for batch effects.
###################################################
芯片数据的标准化可以方便个体之间比较,但是在进行标准化的过程中并未将批次效应移除,而且在有些特殊情况下,进行标准化校正会加剧批次效应的影响。
识别和清除批次效应对芯片数据的影响:
1、DWD (distance weighted discrimination) 距离加权判定
2、PAMR (Passive Aggressive Mean Reversion) 均值集中
Rpackage: pamr
3、ComBat (Empirical Bayes method)经验贝叶斯
基于参数ComBat_p 不基于参数ComBat_n
Rpackage : sva
此外涉及其他的算法和R包,例如包有:snm,psych
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程、基因家族文献思路解读
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘、转录组文献解读
5. 微生物16S/ITS/18S分析原理及结果解读、OTU网络图绘制、cytoscape与网络图绘制课程
6. 生物信息入门到精通必修基础课:linux系统使用、perl入门到精通、perl语言高级、R语言入门、R语言画图
7. 医学相关数据挖掘课程,不用做实验也能发文章:TCGA-差异基因分析、GEO芯片数据挖掘、GEO芯片数据标准化、GSEA富集分析课程、TCGA临床数据生存分析、TCGA-转录因子分析、TCGA-ceRNA调控网络分析
8.其他,二代测序转录组数据自主分析、NCBI数据上传、二代测序数据解读
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!