做WGCNA分析,需要对基因和样本进行一定的筛选。一般来说,会采用如下的筛选方案:
1. 筛选掉基因表达丰低, 在各个样本中变化不大的基因
2. 筛选掉异常的样本
基因的筛选,比较好处理。但是异常样本比较难办,可以参考WGCNA的一份代码,参考如下的代码:
# 计算相似性矩阵 A=adjacency(t(datExpr),type="signed") # 计算网络的连接度 k=as.numeric(apply(A,2,sum))-1 # 连接度标准化 Z.k=scale(k) # 设置连接度筛选阀值, 这部分是关键,筛选掉异常的样本 thresholdZ.k=-2.5 # 将异常样本进行标注 outlierColor=ifelse(Z.k<thresholdZ.k,"red","black") # 删除异常样本 remove.samples= Z.k<thresholdZ.k | is.na(Z.k) datExpr=datExpr[!remove.samples,] datTraits=datTraits[!remove.samples,]
如果您对WGCNA数据挖掘感兴趣,请学习我们的WGCNA相关课程:
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!