文章投稿,除了文好当然还要“颜好”!在这个看脸的世界,为了给文章加分,各位老师学生也是做足功课了!但是不会编程敲代码?——那必须学学各种绘图小工具了。
热图是属于生命科学类型文章中非常常见的一种图片了,此前小编教过大家如何用Excel来画热图(戳这里了解一下啊),但是它有一定的局限性:不能实现聚类分析。今天小编来教大家用一款简单不用安装的小工具——MeV,在绘制热图时聚类、统计、细节设置更简单,图片美观度Up! Up! Up!
MeV
简单了解一下,MeV在热图绘制方面可以说,已经是非常小白式的了,软件下载之后,解压即可使用,无需安装无需插件,下载网址:https://sourceforge.net/projects/mev-tm4/ 。
使用界面如下图所示。
数据载入与设置
为了方便演示,小编整了四十个基因的表达数据,设置了八个样本(如下图),大家可以按照文件格式准备数据,注意:数据另存成Tab键分隔的文本格式进行使用哦!
数据载入通过File,点击Load Data开始(如下图A),跳转到数据导入窗口,选择准备的txt文件,进行导入(如下图B),同时设置图片颜色变化、是否进行注释以及绘图数据区域。
数据第一列默认为ID,背景为浅紫色,绘图数据区域和ID列颜色明显区别(见下图C),如需修改绘图区域,例如排除第二列数据,由第三列开始绘图,鼠标点击第三列第一行之后,第二列数据背景出现浅紫色,故第二列数据不会参会绘图(见下图D)。简单设置之后,点击load,按照部分默认设置出现原始数据热图,例如下图E和F,二者分别对应不同的数据区域选择。
注意:第二次导入数据需要将前次导入的数据进行清除,如下图所示。
数据转换与图片优化
原始数据中,基因表达量大小在0~17左右,数据范围较大,图片效果展示不理想,进行基因内数据标准化,也就是按行标准化,再调整图片标尺,进行图片优化。数据调整通过Adujst Data完成,除标准化之外也可以进行其他形式的转换,例如log转换等(如下图)。
数据调整之后,点击Display,选择Set Color Scale Limits,在小窗口中对颜色和标尺进行修改,例如:将默认的原始数据标尺修改到-1~1之间,中间值为0(如下图A,B)。
修改后,原始数据热图对应的标尺和颜色发生了非常明显的变化(如下图A),而调整数据的热图需要双击Original Data,在展开列表中点击Expression Image,才可以展示出来(如下图B)。
聚类分析
聚类分析是为了将表达趋势相似的基因聚在一起,方便观察和讨论。通过MeV的Analysis下拉列表,或者Clustering可以进行聚类分析(下图A),例如选择层次聚类之后,根据聚类设置,确定是否显示基因、样本聚类树,距离计算,聚类方法等(如下图B),完成设置后,点击OK,即可实现聚类分析过程。
例如,取消样本聚类树,以欧氏距离和平均聚类方法进行分析,可以获得如下图结果,注意,聚类图需要双击HCL后,点击HCL Tree才能展示(针对层次聚类)。
美化设置
到这里,如果还觉图片需要优化,可以通过多种方法进行调整。
例如:修改图片颜色、方框、图片大小、字体类型、字体大小,主要通过Display进行,可以获得如下结果:
再比如:修改聚类树长短和显示,右键选择 Gene Tree properties(如果有样品聚类树,也会有相应设置),在对应的设置选项中进行聚类树调整,点击应用,可获得聚类结果和树长短调整等等(如下图)。
在完成分析和图片美化之后,通过File栏,选择Save image就可以保存成图片了!
总结
相比之R或者Python等利用代码实现画图,MeV对于普通的科研工作者来说,再友好不过了,画起热图来简单易上手。不过你以为MeV只能画图吗?当然不是啦!它还涉及非常多的统计和分析功能,ANOVA、PCA、GSEA等等。小编要继续去学习这个牛叉叉的软件了,你们也加油哦!
如果想提升自己的绘图技能,我们推荐:R语言绘图基础(ggplot2)
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程、基因家族文献思路解读
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘、转录组文献解读
5. 微生物16S/ITS/18S分析原理及结果解读、OTU网络图绘制、cytoscape与网络图绘制课程
6. 生物信息入门到精通必修基础课:linux系统使用、perl入门到精通、perl语言高级、R语言入门、R语言画图
7. 医学相关数据挖掘课程,不用做实验也能发文章:TCGA-差异基因分析、GEO芯片数据挖掘、GEO芯片数据标准化、GSEA富集分析课程、TCGA临床数据生存分析、TCGA-转录因子分析、TCGA-ceRNA调控网络分析
8.其他,二代测序转录组数据自主分析、NCBI数据上传、二代测序数据解读
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!