在作芯片数据或者是转录组数据的GSEA分析时候,需要四个文件:
1、基因表达数据文件;
2、表型数据文件;
3、功能基因集文件;
4、芯片注释文件;
这四个文件只需要分析者提供前两个文件即可,因为GSEA网站已经给大家准备了功能基因集文件及芯片注释文件,分析时直接选取文件就可以。
所以需要大家准备的文件就是表达文件和表型文件。
表达文件格式有四种你可以根据自己的数据类型整理成相应的文件格式:
第一种是GCT:基因表达芯片数据,文本文件格式(* .gct),具体格式如下图所示:
第二种是RES:ExpRESsion(带P和A调用)文件格式(* .res),格式如下图:
第三种是PCL:斯坦福cDNA文件格式(* .pcl),格式如下图所示:
第四种是TXT:表达式数据集的文本文件格式(* .txt),格式如下图所示:
以上四种文件格式都是文本文件,用tab分割,你准备成那种格式的文件,文件的后缀就需要改为那种格式,例如GCT格式的后缀是gct。
第二个需要大家准备的文件是表型文件,表型文件是cls(也是文本文件,以tab分割,后缀必须是cls),格式如下图所示:
以上就是作GSEA分析时要准备的文件。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!