聚类分析用于判断差异基因在不同实验条件下的表达模式,将表达模式相同或相近的基因聚集成类,进而识别未知基因的功能或已知基因的未知功能,这些同类基因可能具有相似的功能,共同参与同一代谢过程或存在于同一细胞通路中。
聚类使用的为R中的聚类软件包,所针对的数据为union_for_cluster(差异基因的并集),以基因的相对表达水平值log2(ratios) 进行聚类。其采用相应的距离算法,算出每个基因之间的距离,然后通过反复迭代,计算基因之间的相对距离,最后根据基因的相对距离远近来分成不同的subcluster,从而实现聚类。该软件包是免费的,只需通过R来运行。K-means聚类的方法,均采用的是R语言相关代码和函数实现的.
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!