有关于GSEA富集分析参数设置

老师,在做GSEA富集分析的时候默认参数没有富集到基因,查阅相关资料,可以通过改变参数富集到基因,但是有关于参数设置的合理性和后期实验验证的可能性,还是有疑问具体想请教:老师,想请教一个有关于富集分析的问题,就是在做gesKEGG和gseGO富集分析的时候需要设置minGSSize和maxGSSize两个参数,这两个参数的理解是放入函数里面的基因数据在某条通路上的基因数据买该范围内才回入选做富集分析统计,还是本身某条通路在现在已经记录的库里面的基因数在设置的范围内才会入选进行富集分析?这两个参数的设置和后期的实验验证是否有关系,什么样的参数设置得到的结果后期实验验证才更容易?

请先 登录 后评论

1 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

GSEA 富集分析是先对两组之间所有基因的表达差异程度(通常是差异比较的fold change)进行排序,之后再看通路里面的基因在排序上是否有富集,具体看看这里:https://www.omicsclass.com/article/230

所以这里的 minGSSize和maxGSSize 是关心的信号通路等里面基因的数量限制,基因数量太少的和太多的信号通路等不纳入GSEA富集分析;

通常设置 minGSSize =15,  maxGSSize=500 ,最后看看你感兴趣的信号通路在不在里面,不在的话再调整一下;

请先 登录 后评论