简单绘制箱线图

用最简单的R代码画出基础的箱线图,两行三行搞定箱线图!

箱线图,又称盒形图,常用来展示数据的整体分布情况,也是目前科研论文中经常出现的一类图形。标准的箱线图包含几个重要的元素,如下图所示,包括下四分位数(第25%数据的大小)、上四分位数(75%数据的大小)、中位数等(中位数大小)等等。这种箱线图怎么画?这里教你用最简单的R代码画出基础的箱线图,两行三行搞定箱线图!

attachments-2019-02-xeDkqlhQ5c63e7731d447.jpg

数据准备

此处准备了24个样本3000个基因的表达数据,由此进行画图。数据原始文件是tab分隔的文本文件,读取数据保存到向量data中,矩阵的基本内容如下(显示5行数据):

head(data,5)
             CK-WT-1    CK-WT-2     CK-WT-3  CK-tdr1-1  CK-tdr1-2  CK-tdr1-3    NaWT-1     NaWT-2     NaWT-3  Natdr1-1
AT1G01010   3.741490   7.361800   5.8173400  5.7113100  7.9705400 10.3762000   6.29949   5.550620   5.847790 15.588100
AT1G01030   5.235280   2.770700   2.6685900  3.2263200  1.3210500  1.9672600   2.40259   3.230770   4.803780  2.043010
AT1G01040   2.821317   1.563395   1.9316282  3.1948090  2.6008540  2.3012776   2.04436   2.104095   2.630611  2.289544
AT1G01050 118.660000 140.143000 123.3830000 97.2229000 95.2539000 91.8525000 121.80800 125.135000 106.507000 81.699700
AT1G01060   1.873769  16.909025   0.9559375  0.4774184  0.5273923  0.4333881  39.10658  36.530250  19.456131 13.222704
           Natdr1-2  Natdr1-3   Na-WT-1  Na-WT-2   Na-WT-3 Na-tdr1-1 Na-tdr1-2 Na-tdr1-3      SWT-1      SWT-2      SWT-3
AT1G01010 14.763600 17.746700  9.849430  7.97949  6.841060 13.291200 25.370000 19.599400   4.966870   5.533490   3.188160
AT1G01030  2.295240  1.952860  1.833770  1.70757  0.809564  3.231720  1.804780  2.060440   8.492560   2.655640   2.255700
AT1G01040  2.801336  2.450605  3.419992  3.50951  2.388678  3.109170  3.559722  2.699009   3.533361   2.779014   1.973365
AT1G01050 84.849500 80.389500 95.484700 93.47060 78.313200 77.220800 93.267700 81.656100 204.019000 251.292000 257.625000
AT1G01060 10.889778 12.258010 74.498380 80.83165 22.768773  1.109817  2.482441 34.885769 209.860515  54.164781  11.474413
            Stdr1-1    Stdr1-2    Stdr1-3
AT1G01010  6.936500  7.8840200 11.2504000
AT1G01030  4.352980  4.5214700  7.1135100
AT1G01040  5.528830  4.9230430  5.6020740
AT1G01050 85.227500 77.5347000 84.9365000
AT1G01060  3.502854  0.9064844  0.3295299

箱线图比较适合对较大数据量进行图片展示,所以实际的绘图的数据可以是来源于不同研究、不同对象的多种统计数据,不拘于案例演示的基因表达数据

基础绘图

利用boxplot基础绘图函数绘制箱线图,除颜色和相关设置之外,只需这基础的一步即可绘制出完整的图片(如下):

cols=rainbow(24) ###针对24个样本,设置颜色,整体呈现彩虹色
par(cex=0.5)    ###设置字体大小
boxplot(data,las=2,main="expression",outline = F,col = cols,notch = T) ###绘图

这里用到的绘图函数boxplot相应的参数解释如下,如需要了解更多参数,对图片进行美化,查询绘图函数即可

#data 绘图矩阵
#las 控制坐标轴标签方向
#main 图片title
#outline 是否显示异常值
#col  图片颜色
#notch 是否显示楔形缺刻

通过这样简单的代码就能画出箱线图?是的,不信你看结果:

attachments-2019-02-SmhoyKnZ5c63e7804d949.jpg




如果想提升自己的绘图技能,我们推荐:R语言绘图基础(ggplot2)


更多生物信息课程:

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程基因家族文献思路解读

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘转录组文献解读

5. 微生物16S/ITS/18S分析原理及结果解读OTU网络图绘制cytoscape与网络图绘制课程

6. 生物信息入门到精通必修基础课:linux系统使用perl入门到精通perl语言高级R语言入门R语言画图

7. 医学相关数据挖掘课程,不用做实验也能发文章:TCGA-差异基因分析GEO芯片数据挖掘GEO芯片数据标准化GSEA富集分析课程TCGA临床数据生存分析TCGA-转录因子分析TCGA-ceRNA调控网络分析

8.其他,二代测序转录组数据自主分析NCBI数据上传二代测序数据解读



  • 发表于 2019-02-13 17:47
  • 阅读 ( 6136 )
  • 分类:R

0 条评论

请先 登录 后评论
Daitoue
Daitoue

167 篇文章

作家榜 »

  1. omicsgene 698 文章
  2. 安生水 347 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 74 文章
  8. CORNERSTONE 72 文章