当前位置: 首页 > news >正文

sheng的学习笔记-AI-k近邻学习(kNN)

AI目录:sheng的学习笔记-AI目录-CSDN博客

什么是k近邻学习

k近邻(k-Nearest Neighbor,简称kNN)学习是一种常用的监督学习方法,是一种基本的分类与回归方法。

  • 分类问题:对新的样本,根据其 k 个最近邻的训练样本的类别,通过多数表决等方式进行预测。
  • 回归问题:对新的样本,根据其 k 个最近邻的训练样本标签值的均值作为预测值。

原理

基本原理

给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个“邻居”的信息来进行预测

通常,在分类任务中可使用“投票法”​,即选择这k个样本中出现最多的类别标记作为预测结果;

在回归任务中可使用“平均法”​,即将这k个样本的实值输出标记的平均值作为预测结果;

还可基于距离远近进行加权平均或加权投票,距离越近的样本权重越大

k近邻学习是惰性学习的代表

懒惰学习

在训练阶段仅仅是把样本保存起来,训练时间开销为零,待收到测试样本后再进行处理

急切学习

在训练阶段就对样本进行学习处理的方法

示意图

k是一个重要参数,当k取不同值时,分类结果会有显著不同。另一方面,若采用不同的距离计算方式,则找出的“近邻”可能有显著差别,从而也会导致分类结果有显著不同

错误概率

下面一坨公式,看得懂就看,看不懂记住结论:

最近邻分类器虽简单,但它的泛化错误率不超过贝叶斯最优分类器的错误率的两倍!

优缺点

  •  k近邻模型具有非常高的容量,这使得它在训练样本数量较大时能获得较高的精度。

  • 它的缺点有:

参考文章

5.knn - 一、k 近邻算法 - 《AI算法工程师手册》 - 书栈网 · BookStack

机器学习  书 

http://www.lryc.cn/news/419841.html

相关文章:

  • ShardingSphere之ShardingProxy集群部署
  • 同态加密和SEAL库的介绍(六)BGV 方案
  • uniapp微信小程序 canvas绘制圆形半透明阴影 createCircularGradient函数不支持透明度部分解决方案
  • W34KN3SS靶机
  • 8.9套题
  • Python 爬取网页水务数据并实现智慧水务前端可视化
  • 百度智能云发布3款轻量级+2款场景大模型
  • UE基础 —— 编辑器界面
  • 2024年Vue组件库大比拼:谁将成为下一个Element?
  • SS9283403 sqlite3交叉编译并部署到SS928(六)
  • java3d-1_4_0_01-windows-i586.exe
  • Vue3中的history模式路由:打造无缝导航体验!
  • python(6)
  • 以Zed项目为例学习大型Rust项目的组织与管理
  • 正点原子imx6ull-mini-Linux驱动之Linux RS232/485/GPS 驱动实验(23)
  • 用户上下文打通+本地缓存Guava
  • Windows图形界面(GUI)-MFC-C/C++ - 树形视图(Tree Control) - CTreeCtrl
  • C语言 --- 枚举、位运算
  • 12322222222
  • 知识改变命运:Java 语言 【可变参数】
  • Spring及相关框架的重要的问题
  • Linux Vim教程
  • 【学习笔记】多进程信号量控制
  • Redis与Memorycache的区别
  • docker和Helm Chart的基本命令和操作
  • Node中的CSRF攻击和防御
  • CSS 多按钮根据半圆弧度排列
  • 【Linux】网络编程套接字Scoket:UDP网络编程
  • 基于模糊PID控制器的puma560机器人控制系统的simulink建模与仿真
  • C语言文件操作超详解