箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比 较。箱线图的绘制方法是:先找出一组数据的最大值、最小值、中位数和两个四分位数;然后, 连接两个四分位数画出箱子;再将最大值和最小值与箱子相连接,中位数在箱子中间。
有时候我们需要对boxplot中的异常值进行去除,这个时候我们可以利用R语言的boxplot完成:
得到离群值的索引:
OutVals = boxplot(x)$out which(x %in% OutVals)
如果想删除离群值:
x[! x %in% OutVals]
不想绘图,只想得到结果可以这样:
OutVals = boxplot(x, plot=FALSE)$out
生物信息入门到精通必修基础课:linux系统使用、biolinux搭建生物信息分析环境、linux命令处理生物大数据、perl入门到精通、perl语言高级、R语言画图、R语言快速入门与提高
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!