在作GSEA的分析时候需要提供一个预先定义好的基因集,用来评估基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的影响作用,那么基因集都包括哪些呢?
GSEA官网的基因集Molecular Signatures Database,含包括H和C1-C7八个系列功能基因集(Collection):
点击这些基因集就会展示更详细的信息:
H: hallmark gene sets (效应)特征基因集合,共50组;
C1: positional gene sets 位置基因集合,根据染色体位置,共326个;
C2: curated gene sets:(专家)共识基因集合,基于通路、文献等:这部分包括我们熟悉的KEGG信号通路等;
C3: motif gene sets:模式基因集合,主要包括microRNA和转录因子靶基因两部分
C4: computational gene sets:计算基因集合,通过挖掘癌症相关芯片数据定义的基因集合
C5: GO gene sets:Gene Ontology 基因本体论,包括BP(生物学过程biological process,细胞原件cellular component和分子功能molecular function三部分)
C6: oncogenic signatures:癌症特征基因集合,大部分来源于NCBI GEO 未发表芯片数据
C7: immunologic signatures: 免疫相关基因集合。
在GSEA的分析时,可以链接网络使用在线的这些基因集,或者把这些基因集下载到本地使用。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!