当前位置：首页 > article >正文

1.23聚类算法（kmeans(初始随机选k，迭代收敛）,DBSCAN（dij选点），MEANSHIFT（质心收敛），AGENS(最小生成树）），蚁群算法（参数理解、过程理解、伪代码、代码）

article 2025/8/27 7:19:02

聚类算法

聚类结果不变

K-means

K值是事先确定好的，是要划分的聚类的数量；初始时随机选择k个点，然后逐渐选择离他最近的点，不断锁定最近的，最后计算方差和；这个是轮流的

这个就类似于模拟退火的思想

当前聚类下的方差和，也称为簇内方差（within-cluster variance），是一种度量聚类质量的指标。它衡量了簇内数据点与各自簇中心的差异程度。方差和越小，表示簇内的数据点越紧密聚集在一起。

计算当前聚类下的方差和的一种常见方法是使用平方欧氏距离（squared Euclidean distance）。具体计算步骤如下：

1. 对于每个簇，计算该簇内所有数据点与簇中心的平方欧氏距离。
2. 将每个簇内所有数据点与簇中心的平方欧氏距离求和。
3. 将所有簇的平方欧氏距离之和作为当前聚类下的方差和。

简化的计算公式如下：

方差和 = Σ(Σ(欧氏距离^2))

其中，Σ表示求和操作，欧氏距离^2表示欧氏距离的平方。

需要注意的是，方差和的计算可能因聚类算法而异，所以在具体应用中，请参考所使用的聚类算法的文档或相关资料，了解更准确的计算方法。

要确定K值，采用肘方法

DBSCAN

带噪声的聚类

两个参数

一个是距离参数，一个是最少点数；就是先从某点（随机点）出现，然后以这个点为圆心向周围辐射，辐射大小是距离参数，之后再以确定的点去确定其他点，就是dij的一个过程

MEANSHIFT均值漂移算法

先选一个半径为r的分析区域，计算质心，然后以质心为圆心再计算，迭代一定次数后最终趋向于最终最密集的地方

AGNES集聚分层聚类算法

能保证最近的两点归于同一组

纵坐标为对应的聚类距离临界值

就是相当于最小生成树的p算法，只不过在相连的时候，如果边的权值大于聚类距离临界值了，就不练了，就作为新的聚类连通图。重复这个过程直到所有点

最优路径问题，蚁群ACO

三个参数，阿尔法，β，挥发系数ρ值

http://www.lryc.cn/news/2417367.html

相关文章：

【设计模式】备忘录模式 ( 简介 | 适用场景 | 优缺点 | 代码示例 )

linux内核register_chrdev_region()系列函数

eclipse中如何使用svn

结构体sockaddr、sockaddr_in、sockaddr_in6之间的区别和联系

I3D模型_2017_CVPR

Framework3.5 最终文件下载及离线安装

OpenGL 入门（一）— 创建窗口

Matlab roundn()函数使用样例

iOS - 融云RTC功能梳理

信息安全-网络安全测评技术与标准

学习心得——析构函数

Android 使用ExpandableListView实现三级列表

Java GUI三种常见的布局方式.FlowLayout,BorderLayout,GridLayout.教程

Linux驱动之模块参数param和符合导出export用法

【MSTP+VRRP实验】华三MSTP+VRRP配置，华三MSTP+VRRP实验

portlet的开发介绍

Win7系统提示找不到LogonUI.exe文件的解决办法

Java解析XML文件--实现读取/导入、写入/导出功能

资源网站mark

手機 Cell ID 與定位

社招网站推荐

【入门】Java使用htmlutil进行数据爬取 {一篇文章让你了解爬虫技术栈}

OpenWrt开发必备软件模块——进程管理服务procd

信号状态关_HINET工业智能网关三种联网模式操作说明

wpf中EventHandler的使用

2023-05-31【05】Windows 10安装Oracle10g客户端

U盘文件系统FAT32、exFAT、NTFS之间有什么区别？

解决 Linux 桌面问题思路分享

自动化无人值守网络装机（PXE网络装机）