在理想的状态我们希望数据没有缺失值。不幸的是,由于各种原因,缺失值会时有发生。这会带来问题。无法在不完整的数据矩阵上进行聚类分析。
Husson和Josse写了一个称为missMDA的包,可以用imputePCA()函数进行缺失值的填充。
library("missMDA") df=read.table("aa.txt",header = T,row.names = 1,sep="\t") df=log1p(df) res.comp <- imputePCA(df,ncp=2) clustering <- hclust(dist(res.comp$completeObs), method = "complete") plot(clustering)
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!