topGO是一个专门用于做GO富集分析的R包,它默认从GO.db中读取GO的分类和结构信息,结合富集分析的结果,它可以画出如下所示的GO有向无环图。ontology指定GO的分类,GO的3大类别BP, CC, MF之间是独立,所以GO其实分为3个子数据库,做富集分析时,不同类别分开做。
下图中5个方块表示有显著富集的GO term;通常我们会设置10个最显著富集的go term ,那么图中就会有10个方块;
KS全称是:Kolmogorov-Smirnov,KS值是通过KS检验所得,KS检验是一种算法。统计方法如下:
- 首先计算每个go节点对应的gene个数,
2. 如果某个节点的子节点也有gene比对上,那么父节点对应的gene个数也要加上子节点的基因数
3. 使用KS统计检验进行p值的计算,文件中的KS值,就是老师常说的p value,叫KS值的原因,是体现使用的KS检验方法。
- Annotated : number of genes in go.db which are annotated with the GO-term.
- Significant : number of genes belonging to your input which are annotated with the GO-term.
- Expected : show an estimate of the number of genes a node of size Annotated would have if the significant genes were to be randomly selected from the gene universe.