当前位置: 首页 > news >正文

【机器学习】第3章 K-近邻算法

一、概念

1.K-近邻算法:也叫KNN 分类 算法,其中的N是 邻近邻居NearestNeighbor的首字母。

(1)其中K是特征值,就是选择离某个预测的值(例如预测的是苹果,就找个苹果)最近的几个值,邻近的意思也很简单,就是距离上最近,距离测算主要分两种。

实际情况就是点的x,y这些值就是这个点的特征,一样的事物最后在坐标轴上位置离得很近,而你把预测值放进去,它离哪个近,可不就是哪个玩意嘛。

如果有几个类挨得特别近,就根据少数服从多数的投票法则,洒洒水啦~

(2)欧氏距离和曼哈顿距离:

2.K值大小的影响:

(1)K过小:造成过拟合,因为样本过少,所以看山是山。

(2)K过大:造成欠拟合,因为样本过多,假设判断的是人种,那么多都是人,那猿猴也有人的特征,很容易就也被归类到人里面了。

3.离差标准化(了解即可):

        当x,z都是两位数的时候,加入y是五位数,那此时y对距离的影响达到了非常大,所以要对其进行标准化,有三种:

4.简单说一下代码:

二、习题

单选题:

2、关于k-近邻算法说法错误的是( D

A  k-近邻算法是机器学习

B  k-近邻算法是监督学习

C  k代表最近的K个样本

D  k的选择对分类结果没有影响

3、关于k-近邻算法说法错误的是( B

A  k-近邻算法可以用来解决回归问题

B  随着k值的增大,决策边界会越来越复杂

C  一般使用投票法进行分类任务

D  距离计算方法不同,效果也可能有显著差别

多选题:

8. K-近邻算法的基本要素包括(ABD )。

A、距离度量   B、K值选择   C、样本大小    D、分类决策规则

判断题:

9. 最近邻算法中,样本的预测结果只由训练集中与其距离最近的那个样本决定。( )

PS:老师的答案是对,但是我搜的是错的。。。。

http://www.lryc.cn/news/376361.html

相关文章:

  • 求和 最大值 最小值 reduce Math.min Math.max
  • MyBatis 源码分析--获取SqlSession
  • Upload-Labs:Pass - 1(JS前端白名单)
  • vue大作业-实现学校官网
  • 24面试记录002
  • cocos 按钮
  • 文件扫描工具都有哪些?职场大佬都在用的文本提取工具大盘点~
  • 【学习】程序员资源网站
  • 游戏缓存与异步持久化的完美邂逅
  • MySQL 高级 - 第十二章 | 数据库的设计规范
  • 【Python】AJAX
  • scikit-image安装报错
  • STM32(七)———TIM定时器(基本and通用)
  • Spring中网络请求客户端WebClient的使用详解
  • 那些年我为了考PMP踩过的坑.....
  • 邦芒解析:新人入职后存在的三种职场心理误区
  • MFC案例:利用SetTimer函数编写一个“计时器”程序
  • 2. 音视频H264
  • 烽宇团队回报社会,走进贵州山区公益行
  • 硬盘格式化NTFS好还是exFAT好 U盘存储文件用哪个格式好? 硬盘用exfat还是ntfs mac不能读取移动硬盘怎么解决
  • Elasticsearch机器学习初探:智能数据洞察
  • 贪心算法——赶作业(C++)
  • Python 数据可视化 多色散点图
  • C语言入门系列:数据类型之浮点数
  • 思科配置路由器,四台主机互相ping通
  • 个人博客测试用例设计
  • Java输入输出语句 和 保留字
  • 生成对抗网络——GAN深度卷积实现(代码+理解)
  • gbase8s数据库阻塞检查点和非阻塞检查点的执行机制
  • ARM32开发--串口库封装(初级)