当前位置: 首页 > news >正文

One-hot编码

One-Hot 编码,又称一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候,其中只有一位有效。

例如:

自然状态码为:000,001,010,011,100,101

独热编码为:000001,000010,000100,001000,010000,100000

可以这样理解,对于每一个特征,如果它有m个可能值,那么经过独热编码后,就变成了m个二元特征。并且,这些特征互斥,每次只有一个激活。因此,数据会变成稀疏的。

这样做的好处主要有:

  1. 解决了分类器不好处理属性数据的问题

  2. 在一定程度上也起到了扩充特征的作用

举例

from sklearn import preprocessing

enc = preprocessing.OneHotEncoder()

enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])

enc.transform([[0, 1, 3]]).toarray()

输出结果:

array([[ 1., 0., 0., 1., 0., 0., 0., 0., 1.]])

http://www.lryc.cn/news/38281.html

相关文章:

  • Java中的深克隆与浅克隆
  • 如何使用MyBatis框架实现对数据库的增删查改?
  • 结构体内存大小
  • gerrit操作和jinkens编译合入代码
  • 网络工程师面试题(面试必看)(3)
  • 第N次重装系统之Ubtntu
  • 一个 适用 vue3 ts h5移动端 table组件
  • Vue.js 生产打包上线实战
  • C语言指针的算术运算
  • 快速排序/快速选择算法
  • 【数据结构初阶】单链表面试题|内含链表带环问题
  • 一文解析ethtool 命令的使用
  • 深度学习训练营之yolov5训练自己的数据集
  • Java中的AQS
  • Spring——案例-业务层接口执行效率和AOP通知获取数据+AOP总结
  • 国外SEO舆情处理最佳黄金时间
  • ROC和AUC
  • Dopamine-PEG-cRGD,DOPA-PEG-cRGD,多巴胺-聚乙二醇-crgd细胞穿膜肽
  • 动态规划回文子串
  • windows 域控提权CVE-2014-6324CVE-2020-1472CVE-2021-42287CVE-2022-26923
  • 1、JDK 安装 Java环境变量配置
  • [c++]list模拟实现
  • 实用的仓库管理软件有哪些,盘点2023年5大仓库管理软件!
  • (八十二)透彻研究通过explain命令得到的SQL执行计划(1)
  • 【Linux】旋转锁 | 读写锁
  • EasyExcell导出excel添加水印
  • SpringCloud:Nacos配置管理
  • 正则表达式引擎NFA自动机的回溯解决方案总结
  • 卷积神经网络之AlexNet
  • React中setState什么时候是同步的,什么时候是异步的?