当前位置: 首页 > news >正文

K-Means和KNN

主要区别

从无序 —> 有序
从K-Means —> KNN

  • KNN:监督学习,类别是已知的,对已知分类的数据进行训练和学习,找到不同类的特征,再对未分类的数据进行分类。
  • K-Means:无监督学习,事先不知道数据有几类,通过聚类分析将数据聚合成几个群体。聚类不需要对数据进行训练和学习。

KNN

原理

将预测点与所有点的距离进行计算,然后保存并排序,选出前面K个值看看哪些类别比较多,则预测的点就属于哪一类。
KNN也可以用于回归预测

算法步骤

对未知类别属性的数据集中每个点依次执行以下操作:

  1. 计算已知类别数据集中的点与当前点之间的距离;
    通常使用的是欧氏距离
  2. 按照距离递增次序排序;
  3. 选取与当前点距离最小的k个点;
    如何确定k?
    通过交叉验证,从选取一个较小的k值开始,不断增加k的值,然后计算验证集合的方差,最终找到一个比较合适的k值。
  4. 确定前k个点所在类别的出现频率;
  5. 返回前k个点出现频率最高的类别作为当前点的预测分类。

K-Means

原理

随机选取质心——计算各样本点和质心的距离后分类——再次选择新的质心
【扩展】
邻近度函数(即距离计算):
(1)曼哈顿距离:质心——中位数,目标函数——最小化对象到簇质心的距离和;
(2)平方欧几里得距离:质心——均值,目标函数——最小化对象到簇质心的距离的平方和;
(3)余弦距离:质心——均值,目标函数——最大化对象与其质心的余弦相似度和;
(4)Bregman散度:质心——均值,目标函数——最小化对象到簇质心的Bregman散度和。

算法步骤

  1. 随机选取k个质心(k值取决于想聚成几类);
  2. 计算样本到质心的距离,距离质心近的归为一类,分为k类;
  3. 求出分类后的每类的新质心;
  4. 再次计算样本到新质心的距离,距离质心距离近的归为一类;
  5. 判断新旧聚类是否相同,如果相同就代表已经聚类成功,如果没有则循环2-4。

在这里插入图片描述
在这里插入图片描述

http://www.lryc.cn/news/207671.html

相关文章:

  • 【Python】【Flask】flask_login的初始化
  • Spring Cloud之API网关(Gateway)
  • nodejs+vue 电子书阅读系统
  • 百度文心一言4.0抢先体验教程!
  • 单目3D目标检测 方法综述——直接回归方法、基于深度信息方法、基于点云信息方法
  • oracle,CLOB转XML内存不足,ORA-27163: out of memory ORA-06512: at “SYS.XMLTYPE“,
  • PHP与mysql数据库交互
  • 【广州华锐视点】VR飞行员驾驶模拟实训系统
  • 太烂的牌也要打完只为自己也不是为了其他什么原因。
  • SDL窗口创建以及简单显示(1)
  • 【Html】交通灯问题
  • 用IntelliJ远程打断点调试
  • Spring-Bean的生命周期概述
  • SENet 学习
  • 目前和未来的缓存构建
  • aws亚马逊云免费账号代充值!!!什么是 AWS Lambda?
  • 《从零开始大模型开发与微调 :基于PyTorch与ChatGLM》简介
  • 【LeetCode】102. 二叉树的层序遍历
  • golang连接池检查连接失败时如何重试
  • 从JavaScript到Rust的三年时间小结
  • 【Python机器学习】零基础掌握VotingRegressor集成学习
  • 云计算模式的区域LIS系统源码,基于ASP.NET+JQuery、EasyUI+MVC技术架构开发
  • 面向对象设计原则之接口隔离原则
  • haproxy 负载均衡
  • 在el-dialog中使用tinymce 点击工具栏下拉框被遮挡
  • CloudQuery + StarRocks:打造高效、安全的数据库管控新模式
  • 各类统计模型R语言的详细使用教程-R语言的线性回归使用教程
  • 点云从入门到精通技术详解100篇-基于尺度统一的三维激光点云与高清影像配准
  • <蓝桥杯软件赛>零基础备赛20周--第2周
  • CMake多文件构建初步