GEO2R是GEO在线分析工具,基于此工具可以对部分GEO样品数据进行基因差异表达分析。该工具主要针对芯片数据,借助R 及Limma包完成分析过程,用户只需要在网业上进行简单的点击等手动操作即可获得分析结果。
以下内容,将利用案例数据GSE106876 (B细胞淋巴瘤9个样本数据)进行演示。
GEO2R分析页面
通过GEO主页Tools,点击Analyze a Study with GEO2R,可进入GEO2R分析页面(网址:https://www.ncbi.nlm.nih.gov/geo/geo2r/),页面显示如下图A。
在搜索栏中输入GEO accession 搜索需要分析的数据,注意,登录号只能是GSE登录号。以GSE106876为例,搜索结果如下图B。若对应的GSE数据不能利用GEO2R在线工具分析,网址会进行提示。
差异分组
搜索出所有样品之后,选择Define groups,选定差异比较分组的样品(如果是多平台数据,请先确定平台)。在Define groups下拉输入框中,先输入control,点击Enter键,确定第一个分组,同样输入第二个分组tumour,设定第二组。(注意先后顺序,对照在前,处理在后)。
选中样品之后,点击分组(control or tumour),例如案例中control选中了三个样品,tumour选中三个样品,具体见下图。
设定分组之后,点击Top250,可以依据网址的默认设置参数,进行差异分析,并显示分析结果的前250个(如下图)。列表结果中会显示出计算的相关数据,包括P值,logFC,以及相关的基因信息等等,而通过页面Save all results,可以针对所有的数据分析下载保存,不限于Top250。
点击左侧单个探针ID,可以查看到该ID对应数据变化的分布情况,如下图所示,由样本数据中该探针对应的表达量变化图片,结合logFC 值-3.68,可以看到,该探针对应的基因出现了下调(P.adjust=0.0256)。
数据分布
基于选中的六个样品,选择Value distribution,点击veiw,可以查看该六个样品的数据分布情况,显示结果为box 分布图(如下图)。如果需要所有样品的数据分布图,删除分组设置即可。
参数修改
点击Options,可以进入差异比较的参数设置页面(如下图),可以对P值矫正方法,数据转换方法,以及相关信息显示进行修改。
其他
此外,还可以通过Profile Graph 查找单基因表达谱,以及通过R script,查看改组差异分析对应的R代码。
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程、基因家族文献思路解读
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘、转录组文献解读
5. 微生物16S/ITS/18S分析原理及结果解读、OTU网络图绘制、cytoscape与网络图绘制课程
6. 生物信息入门到精通必修基础课:linux系统使用、perl入门到精通、perl语言高级、R语言入门、R语言画图
7. 医学相关数据挖掘课程,不用做实验也能发文章:TCGA-差异基因分析、GEO芯片数据挖掘、GEO芯片数据标准化、GSEA富集分析课程、TCGA临床数据生存分析、TCGA-转录因子分析、TCGA-ceRNA调控网络分析
8.其他,二代测序转录组数据自主分析、NCBI数据上传、二代测序数据解读
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!