当前位置: 首页 > news >正文

聚类的外部指标(Purity, ARI, NMI, ACC) 和内部指标(NCC,Entropy,Compactness,Silhouette Index)

在聚类分析中,外部指标和内部指标用于评估聚类结果的质量。外部指标需要知道真实的类别标签,而内部指标则仅基于聚类结果本身进行评估。

外部指标
Purity (纯度): 计算聚类结果中每个簇中最多数目的样本所属的类别,并计算所有簇的该类别样本数之和占所有样本数的比例。
Python (使用 sklearn):

python
复制代码
from sklearn import metrics  
from sklearn.datasets import make_blobs  
from sklearn.cluster import KMeans  
  
# 假设 X 是数据, y 是真实标签  
# 聚类...  
kmeans = KMeans(n_clusters=3)  
labels_pred = kmeans.fit_predict(X)  
  
# 计算纯度 (需要自定义函数)  
def purity_score(y_true, y_pred):  
    contingency_matrix = metrics.cluster.contingency_matrix(y_true, y_pred)  
    return np.sum(np.amax(contingency_matrix, axis=0)) / y_true.shape[0]  
  
purity = purity_score(y, labels_pred)  
print(f"Purity: {purity}")
Matlab:

在 Matlab 中,没有直接的 purity 函数,但可以通过混淆矩阵计算。

Adjusted Rand Index (ARI): 衡量两个聚类结果之间的相似度。
Python (使用 sklearn):

http://www.lryc.cn/news/366330.html

相关文章:

  • 国标GB/T 28181详解:国标GBT28181-2022的客户端主动发起历史视音频回放流程
  • Vue项目安装axios报错npm error code ERESOLVE npm error ERESOLVE could not resolve解决方法
  • 【Linux】Centos7升级内核的方法:yum更新(ELRepo)
  • 【CSS】object-fit 和 object-position 属性详解
  • 【算法专题--栈】最小栈--高频面试题(图文详解,小白一看就会!!)
  • Vite项目构建chrome extension,实现多入口
  • 【vector模拟实现】附加代码讲解
  • 本地运行ChatTTS
  • 应用解析 | 面向智能网联汽车的产教融合解决方案
  • 华为设备动态路由OSPF(单区域+多区域)实验
  • R语言探索与分析19-CPI的分析和研究
  • 【C++ | 拷贝构造函数】一文了解C++的 拷贝(复制)构造函数
  • 【工具】Vmware17 安装mac(13.6.7)虚拟机
  • mac node版本切换 nvm install nvm ls-remote N/A问题
  • 牛客小白月赛95
  • Python实现调用并执行Linux系统命令
  • 古字画3d立体在线数字展览馆更高效便捷
  • 编写程序,提示用户输入以米/秒(m/s)为单位的速度v和以米/秒的平方(m/s)为单位的加速度 a,然后显示最短跑道长度。
  • k8s 对外发布(ingress)
  • FL Studio21.2.7最新中文破解版免费激活,音乐制作全掌握!
  • 2 - 寻找用户推荐人(高频 SQL 50 题基础版)
  • 高考志愿填报有哪些技巧和方法
  • codereview时通常需要关注哪些
  • DSP28335模块配置模板系列——定时器中断配置模板
  • 使用 Apache Commons Exec 自动化脚本执行实现 MySQL 数据库备份
  • 【中间件系列】浅析redis是否适合做消息队列
  • [NOVATEK] NT96580行车记录仪功能学习笔记
  • 创新案例 | AI数据驱动下的全域数字化转型的五大关键洞见
  • 学习笔记——网络参考模型——TCP/IP模型(网络层)
  • AI初识--LLM、ollama、llama都是些个啥?