一文教你使用Excel画GO富集分析图

你会画GO富集分析图么?你知道用哪些数据来画么?这里有详细教程。

做完转录组测序分析,从公司拿到的结果中一般都会有GO富集分析的结果文件。

公司的分析都是标准化的,相应的GO富集分析图上展示的一般是前20位富集程度最高的GO条目,没有经过qvalue值的筛选。

如果你想筛选一下qvalue值或者其他参数再做GO富集分析图,那么请继续往下看。小编为您讲解如何使用Excel画GO富集分析图。


数据文件准备

转录组测序分析的结果文件中一般都会有GO_enrich.xls的文件,该文件一般在每个差异组合的差异分析结果文件夹下。打开后格式大致如下图所示,各个公司稍有不同,图上红色箭头所指的列应该都有,这几列分别是:Term_type、Description、Corrected_P-value、Rich_factor。

attachments-2020-05-WZsNiHOs5ecdc977234bb.png

假设我们经过筛选之后使用前20个富集条目进行富集分析作图。作图时,我们选择图上显示Term_type、Description、Corrected_P-value共三个值,当然你也可以显示Rich_factor而不显示Corrected_P-value。
由于Corrected_P-value值从0-1都有,大小不一且差距较大,为了方便作图,我们需要对Corrected_P-value进行对数化,即转化为-log10(Corrected_P-value),注意是求负值。在Excel中即是插入一列,然后使用log函数求出相应的值即可。

attachments-2020-05-egIXDjnI5ecdc98ec44af.png

为了把GO注释的三大类放在一起,我们需要对其进行筛选排序。attachments-2020-05-kVHgu5v15ecdc9a27b50f.png

排序之后,我们把三大类相同的类型进行合并,以便后续作图。

attachments-2020-05-ODdI6wTR5ecdc9b5bd44b.png

到这一步,数据的准备工作就完成了,接下来就是图形的绘制。


画GO富集分析图画GO富集分析图

1、插入条形图,具体步骤为:插入-条形图-二维条形图。得到如下图空白图形所示。

attachments-2020-05-Oc3Ud0x75ecdc9f5ade31.png

2、点击“选择数据”,弹出“选择数据源”对话框,点击“图例项(系列)”下的“添加”,弹出“编辑数据系列”对话框(其中“系列名称”空置),“系列值”选取上一步取对数后的“log10(Corrected_P-value)”,然后点击“确定”返回“选择数据源”对话框。

attachments-2020-05-QcQyVgCr5ecdca06b9fd9.png

3、点击“水平(分类)轴标签”下的“编辑”,弹出“轴标签”对话框,选定区域为“Term_type”和“Description”两列,点击“确定”即可得到初步的效果图。

attachments-2020-05-rlQoe7cm5ecdca55cd164.pngattachments-2020-05-dwvg2GdR5ecdca60e325b.png


图片的美化

1、添加横坐标轴标题:

菜单栏“布局”-“坐标轴标题”-“主要横坐标轴标题”-“坐标轴下方标题”,输入内容为“-log10(Corrected_P-value)”。

attachments-2020-05-VkPl9JaX5ecdcb151c933.png

2、修饰坐标轴:
横坐标:

菜单栏“布局”-“坐标轴”-“主要横坐标轴”-“其他主要横坐标轴选项(M)”,“主要刻度线类型”选择“内部”,“次要刻度线类型”选择“无”,“坐标轴标签”选择“轴旁”。

attachments-2020-05-Fs29WKGy5ecdcb3a2a504.png

纵坐标:

菜单栏“布局”-“坐标轴”-“主要纵坐标轴”-“其他主要纵坐标轴选项(M)”,“主要刻度线类型”选择“无”,“次要刻度线类型”选择“无”,“坐标轴标签”选择“轴旁”。

attachments-2020-05-lB7MC08Z5ecdcb559a50c.png

3、网格线修改:
菜单栏“布局”-“网格线”-“主要纵网格线”-“无”。

attachments-2020-05-l9hyhcPX5ecdcb850fea1.png

4、数据类型颜色修改:
三大类别,一类一种颜色,比如设置:Molecular Function红色,Cellular Component绿色,Biological Process蓝色。这一步没有办法批量修改,只能逐个修改。双击条形,弹出“设置数据点格式”对话框,选择“填充”-“纯色填充”,选择颜色。

attachments-2020-05-vMg59OdF5ecdcb953995a.png

颜色修改之后,得到如下所示图,但是右侧“图例”显示的很乱,没有按照三大类显示。接下来就得修改图例。

attachments-2020-05-hpfUXDxV5ecdcbaf649ff.png

5、图例的修改:
选中图例进删除,每一种颜色只保留一个图例即可。
选中图例,右键-字体颜色选择白色,将原有的图例内容隐藏。

attachments-2020-05-IPSt13Ss5ecdcbbf77856.png

插入文本框,输入三大类内容,调整字体大小以及文本框的位置,整合文字和图例色标到合适的位置。

attachments-2020-05-ri6Y5XFY5ecdcbe0d25f4.png

6、到这里,图就基本调整完成了,不过还有一些瑕疵,比如大类别“Cellular Component”的显示不太好、整个图片上字体的格式不太好,都可以加以调整。只要右键打开字体调整的对话框进行调整即可。

attachments-2020-05-wehxV6Ja5ecdcc01dcdee.png


最终图片如下所示,所谓最终只是小编调整的最终图片,你也可以根据你的审美进行图片字体、颜色、线条等等的调整。

attachments-2020-05-mDqqfkR55ecdcc1b48b79.png

图片绘制完成之后,最好能保存成pdf格式的图片,这样可以保证图片不会失真。小编建议使用AI进行图片的导出和编辑。当然,学会使用AI之后,图例、图形颜色、字体等都可以在AI上进行更加专业的修改。有兴趣的朋友可以自行学习一下《带你“AI”编辑》这篇文章。
如果您想学习更多更专业的转录组数据挖掘技巧,那么可以扫描下图二维码学习相关视频课程。attachments-2020-05-EReqJyIU5ecdc45b6b052.jpg

更多生物信息课程:

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程基因家族文献思路解读

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘转录组文献解读

5. 微生物16S/ITS/18S分析原理及结果解读OTU网络图绘制cytoscape与网络图绘制课程

6. 生物信息入门到精通必修基础课,学习链接:linux系统使用perl入门到精通perl语言高级R语言画图

7. 医学相关数据挖掘课程,不用做实验也能发文章,学习链接:TCGA-差异基因分析GEO芯片数据挖掘GSEA富集分析课程TCGA临床数据生存分析TCGA-转录因子分析TCGA-ceRNA调控网络分析

8.其他课程链接:二代测序转录组数据自主分析NCBI数据上传二代测序数据解读

  • 发表于 2020-05-27 09:38
  • 阅读 ( 14695 )
  • 分类:软件工具

2 条评论

请先 登录 后评论
生信老顽童
生信老顽童

61 篇文章

作家榜 »

  1. omicsgene 702 文章
  2. 安生水 350 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. rzx 78 文章
  7. 红橙子 78 文章
  8. CORNERSTONE 72 文章