按范围统计数值分布,并用ggplot2绘制饼图;
R处理大数据时偶尔会出现out of memory的问题,相关解决方法: 1、memory.size()查看当前work space内存使用状况(MB) 2、memory.limit()查看当前work space运行使用内存的上限 > memo...
R 删除重复数据的方法,包括duplicated 和unique 针对duplicated, 对向量的元素或数据框的行进行操作的时候,返回逻辑值,以下面的数据框为例: dat A B C D1 a b a c2 c k b d3 c k c c4...
系统聚类Hierarchical clustering(层次聚类、谱系聚类)— 最短距离法(single linkage)— 最长距离法 (complete linkage)— 中间距离法 (median method)— 可变距离法 (flexible median)— 重心...
列举ggplot2的geom设置内容,方便查找绘图对应方法
readxl包括多个可以读取excel的函数,比之xlsx包更方便
利用ggplot2进行火山图的绘制
借助reshape2包melt函数对数据进行整形处理,改变数据组合方式
使用R语言绘制类似于箱线图的散点图
AnnotationDbi 和 结合物种对应的注释文件,将ENSEMBL ID转换成Gene ID(ENTREZID)
利用subset针对数据框按照条件进行判断和筛选数据
在R中利用split,借助数据的分类类型,对数据进行分组
1.安装zlib1.2.5版本及以上 cd zlib-1.2.11 ./configure --prefix =/share/work/biosoft/zlib make make install 2.安装bzip cd bzip2-1.0.6 make -f Makefile-libbz...
Igraph软件安装错误
对数据中存在的NA情况进行处理,替换或者删除
在进行数据集处理时,经常会合并两个数据集,这里说一下合并数据集常用的2个函数: 合并列:cbind 合并行:rbind 1.cbind cbind使用非常直观简单。当我们需要直接合并2个矩阵或数据框,不需...
利用aggregate对数据进行分组处理,包括分组求和,分组取均值,最大值,中位数等等
R语言中常见的基本字符串处理,涉及匹配、替换、分割、截取、大小写转换等等
利用“xlxs"读取真Excel文件中的内容
利用ggplot2绘制密度图,并直接在密度图上叠加另一组数据的密度曲线