加入收藏 | 设为首页 | 会员中心 | 我要投稿 银川站长网 (https://www.0951zz.com/)- 云通信、基础存储、云上网络、机器学习、视觉智能!
当前位置: 首页 > 大数据 > 正文

介绍基于凸集投影方法的聚类算法

发布时间:2023-05-17 15:57:58 所属栏目:大数据 来源:
导读:神经网络分析(或聚类)是一种数据挖掘技术,它会探索和分组一组向量(或信息点),使同一聚类中的向量彼此之间比其他聚类中的向量更相似。聚类算法被广泛应用于例如数据分析、模式识别和图像处理等许多应用场景中。
神经网络分析(或聚类)是一种数据挖掘技术,它会探索和分组一组向量(或信息点),使同一聚类中的向量彼此之间比其他聚类中的向量更相似。聚类算法被广泛应用于例如数据分析、模式识别和图像处理等许多应用场景中。

本文将介绍一种新的基于凸集投影(POCS:Projection onto Convex Sets)方法的聚类算法,称为基于POCS的聚类算法。最初的论文在IWIS2022中介绍,源代码也已在Github上发布。

独集定义与启示

凸集被定义为一组数据点,其中连接该集合中任意两个点x1和x2的线段完全包含在该集合中。根据凸集的定义,空集∅、单例集、线段、超平面和欧氏球都被认为是凸集。数据点也被认为是凸集,因为它是单例集(一个只有一个元素的集合)。由这一概念启示我们发现一条新的研究路径,即凸集投影的概念可以应用于聚类数据点。

独集投影

首先,让我们一起简单回顾一下凸集投影的概念(没有方程式)。图集投影的方法大致可以分为两种形式:交替和平行。

交替凸起投影

从数据空间中的任意点开始,从该点到两个(或多个)相交凸集的交替投影将收敛到集合的交点内的一个点。

当凸集不相交平行时,三个交替圆形投影将收敛到第二次的贪婪极限环,贪婪极限环不可分辨地取决于三个投影的阶数。

平行凸集投影

与交替形式不同,并行形式的凸集投影同时执行从数据点到所有凸集的投影,并且每个投影具有重要的权重。对于两个非空相交凸集,类似于交替版本,平行投影收敛到集合的相交点。

在不相交凸集的情况下,投影将收敛到最小化解。基于凸集投影的聚类算法的主要思想正是从这一性质出发产生的。

有关凸集投影的更多详细信息,您可以访问原始论文和/或其他一些推荐论文(包括可用的pdf文件):

模糊凸集上的交替投影

膨胀凸集投影:极小极大凸优化
基于凸集投影方法的聚类算法
利用并行凸集投影方法的收敛性,作者提出了一种非常简单但(在一定程度上)有效的聚类算法。该算法以类似于经典K-Means算法的精神进行操作,但每个算法处理每个数据点的方式存在差异,即K-Means方法以相等的加权重要性处理每个数据点。然而,另一方面,基于凸集投影的聚类算法,以不同的重要性权重处理每个数据点,该重要性权重与从数据点到集群原型的距离成正比。因此,如果要实现高效的分类,就必须在不同的聚类算法之间进行切换。这种情况下,需要一种新的方法来解决这个问题。

(编辑:银川站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!