SOM(Self-organising maps,自组织)简单介绍

SOM(自组织)简单介绍


SOM 简介

SOM 即自组织映射,是一种用于特征检测的无监督学习神经网络。它模拟人脑中处于不同区域的神经细胞分工不同的特点,即不同区域具有不同的响应特征,而且这一过程是自动完成的。SOM 用于生成训练样本的低维空间,可以将高维数据间复杂的非线性统计关系转化为简单的几何关系,且以低维的方式展现,因此通常在降维问题中会使用它。


SOM 与其它人工神经网络不同,因为它们使用的是竞争性学习而不是错误相关的学习,后者涉及到反向传播和梯度下降。在竞争性学习中,各个节点会相互竞争响应输入数据子集的权利。训练数据通常没有标签,映射会学习根据相似度来区分各个特征。attachments-2018-12-JaS7vYHV5c1c94da3eb2a.jpg


SOM 的工作原理


下图展示了 SOM 的训练过程。紫色区域表示训练数据的分布状况,白色网格表示从该分布中提取的当前训练数据。首先,SOM 节点位于数据空间的任意位置。最接近训练数据的节点(黄色高亮部分)会被选中。它和网格中的邻近节点一样,朝训练数据移动。在多次迭代之后,网格倾向于近似该种数据分布(下图最右)。

attachments-2018-12-4Awb2eap5c1c94f2d0e15.jpg

当我们将训练数据输入到网络中时,会计算出所有权重向量的欧几里德距离。权重向量与输入最相似的神经元称为最佳匹配单元(BMU)。BMU 的权重和 SOM 网格中靠近它的神经元会朝着输入矢量的方向调整。一旦确定了 BMU,下一步就是计算其它哪些节点在 BMU 的邻域内。


自组织的组成部分


  • 初始化:将所有连接权重初始化为随机值。
  • 竞争:输出节点相互竞争激活的机会,每次只有一个被激活。激活的神经元就叫做“赢家通吃”神经元。由于存在这种竞争,神经元被迫自我组织,形成自组织映射(SOM)。
  • 合作:在竞争中获胜的神经元会决定活跃神经元拓扑邻域的空间位置,为相邻神经元之间的合作提供了基础。
  • 适应:活跃神经元会降低判别函数的个体值,通过适当调整相关连接权重来完成(和输入模式相关)。这样,获胜神经元对随后应用同样输入模式的响应就会得到增强。判别函数定义为每个神经元j的输入向量x和权重向量wj之间的平方欧几里德距离:
    attachments-2018-12-h1rYJ7Mg5c1c95048fbec.jpg

训练 SOM 的步骤


训练 SOM 涉及以下几步:

  1. 初始化每个节点的权重。权重设置为标准化小型随机值。
  2. 从训练集中随机选择一个向量并呈现给网格。
  3. 检查每个节点来计算哪一个的权重最像输入向量。这会让你获得最佳匹配单元(BMU)。我们通过迭代所有节点并计算每个节点的权重与当前输入向量之间的欧几里德距离来计算BMU。权重向量和输入向量最接近的节点则被标记为BMU。
  4. 计算BMU邻域的半径。在半径范围内找到的节点则认为处于BMU邻域内。
  5. 调整在步骤4中发现的节点的权重,让它们更像输入向量。节点和BMU越近,权重调整的越多。
  6. 重复步骤2,迭代N次。


SOM 的应用

SOM 通常用在可视化中。比如下图,世界各国贫困数据的可视化。生活质量较高的国家聚集在左上方,而贫困最严重的国家聚集在右下方。

attachments-2018-12-qYDkQHQU5c1c951960cf0.jpg


本文转自:https://www.zhihu.com/question/28046923/answer/75842529

  • 发表于 2018-12-21 15:24
  • 阅读 ( 6307 )
  • 分类:转录组

你可能感兴趣的文章

相关问题

1 条评论

请先 登录 后评论
microRNA
microRNA

115 篇文章

作家榜 »

  1. omicsgene 702 文章
  2. 安生水 350 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 76 文章
  8. CORNERSTONE 72 文章