箱线图,又称盒形图,常用来展示数据的整体分布情况,也是目前科研论文中经常出现的一类图形。标准的箱线图包含几个重要的元素,如下图所示,包括下四分位数(第25%数据的大小)、上四分位数(75%数据的大小)、中位数等(中位数大小)等等。这种箱线图怎么画?这里教你用最简单的R代码画出基础的箱线图,两行三行搞定箱线图!
此处准备了24个样本3000个基因的表达数据,由此进行画图。数据原始文件是tab分隔的文本文件,读取数据保存到向量data中,矩阵的基本内容如下(显示5行数据):
> head(data,5)
CK-WT-1 CK-WT-2 CK-WT-3 CK-tdr1-1 CK-tdr1-2 CK-tdr1-3 NaWT-1 NaWT-2 NaWT-3 Natdr1-1
AT1G01010 3.741490 7.361800 5.8173400 5.7113100 7.9705400 10.3762000 6.29949 5.550620 5.847790 15.588100
AT1G01030 5.235280 2.770700 2.6685900 3.2263200 1.3210500 1.9672600 2.40259 3.230770 4.803780 2.043010
AT1G01040 2.821317 1.563395 1.9316282 3.1948090 2.6008540 2.3012776 2.04436 2.104095 2.630611 2.289544
AT1G01050 118.660000 140.143000 123.3830000 97.2229000 95.2539000 91.8525000 121.80800 125.135000 106.507000 81.699700
AT1G01060 1.873769 16.909025 0.9559375 0.4774184 0.5273923 0.4333881 39.10658 36.530250 19.456131 13.222704
Natdr1-2 Natdr1-3 Na-WT-1 Na-WT-2 Na-WT-3 Na-tdr1-1 Na-tdr1-2 Na-tdr1-3 SWT-1 SWT-2 SWT-3
AT1G01010 14.763600 17.746700 9.849430 7.97949 6.841060 13.291200 25.370000 19.599400 4.966870 5.533490 3.188160
AT1G01030 2.295240 1.952860 1.833770 1.70757 0.809564 3.231720 1.804780 2.060440 8.492560 2.655640 2.255700
AT1G01040 2.801336 2.450605 3.419992 3.50951 2.388678 3.109170 3.559722 2.699009 3.533361 2.779014 1.973365
AT1G01050 84.849500 80.389500 95.484700 93.47060 78.313200 77.220800 93.267700 81.656100 204.019000 251.292000 257.625000
AT1G01060 10.889778 12.258010 74.498380 80.83165 22.768773 1.109817 2.482441 34.885769 209.860515 54.164781 11.474413
Stdr1-1 Stdr1-2 Stdr1-3
AT1G01010 6.936500 7.8840200 11.2504000
AT1G01030 4.352980 4.5214700 7.1135100
AT1G01040 5.528830 4.9230430 5.6020740
AT1G01050 85.227500 77.5347000 84.9365000
AT1G01060 3.502854 0.9064844 0.3295299
箱线图比较适合对较大数据量进行图片展示,所以实际的绘图的数据可以是来源于不同研究、不同对象的多种统计数据,不拘于案例演示的基因表达数据。
利用boxplot基础绘图函数绘制箱线图,除颜色和相关设置之外,只需这基础的一步即可绘制出完整的图片(如下):
cols=rainbow(24) ###针对24个样本,设置颜色,整体呈现彩虹色
par(cex=0.5) ###设置字体大小
boxplot(data,las=2,main="expression",outline = F,col = cols,notch = T) ###绘图
这里用到的绘图函数boxplot相应的参数解释如下,如需要了解更多参数,对图片进行美化,查询绘图函数即可。
#data 绘图矩阵
#las 控制坐标轴标签方向
#main 图片title
#outline 是否显示异常值
#col 图片颜色
#notch 是否显示楔形缺刻
通过这样简单的代码就能画出箱线图?是的,不信你看结果:
如果想提升自己的绘图技能,我们推荐:R语言绘图基础(ggplot2)
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程、基因家族文献思路解读
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘、转录组文献解读
5. 微生物16S/ITS/18S分析原理及结果解读、OTU网络图绘制、cytoscape与网络图绘制课程
6. 生物信息入门到精通必修基础课:linux系统使用、perl入门到精通、perl语言高级、R语言入门、R语言画图
7. 医学相关数据挖掘课程,不用做实验也能发文章:TCGA-差异基因分析、GEO芯片数据挖掘、GEO芯片数据标准化、GSEA富集分析课程、TCGA临床数据生存分析、TCGA-转录因子分析、TCGA-ceRNA调控网络分析
8.其他,二代测序转录组数据自主分析、NCBI数据上传、二代测序数据解读
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!