当前位置: 首页 > news >正文

机器学习基本上就是特征工程——《特征工程训练营》

作为机器学习流程的一部分,特征工程是对数据进行转化以提高机器学习性能的艺术。

当前有关机器学习的讨论主要以模型为中心。更应该关注以数据为中心的机器学习方法。

本书旨在介绍流行的特征工程技术,讨论何时以及如何运用这些技术的框架。我发现,有些书籍只关注其中一方面,有时可能显得有些单薄。专注于概述的书籍往往忽略了实际应用的一面,而专注于框架的书籍可能让读者产生疑问:“为什么这样做有效呢?”


本书面向已经踏入机器学习领域并寻求提升能力与技能的机器学习工程师和数据科学家。假设读者已经掌握机器学习、交叉验证、参数调优以及使用 Python 和 scikit-learn 进行模型训练的基础知识。本书在此基础上进一步拓展,将特征工程流程直接融入现有的机器学习框架中,以提供更深入的学习体验。

特征工程的四个步骤包括特征理解、特征结构化、特征优化和特征评估。

特征理解--为了更好地解释数据。

特征结构化--为了在机器学习中有效组织数据。

特征优化--为了尽可能地从数据中提取信号和模式。

特征评估--根据机器学习调整特征工程。

数据科学家将超过一半的时间都花费在整理和操作数据上;值得花费充分的时间来整理数据集,以使所有下游任务更加轻松和有效。

优秀的特征工程能够产生更高效的数据集,使我们能够采用更快速、更小的模型,而不是依赖于通过混乱数据训练出来的缓慢而复杂的模型。

本书提供了许多案例研究,帮助读者真正学习和运用特征工程技术。

● 识别和实现特征转换

● 用非结构化数据构建ML(机器学习)流程

● 量化并尽量避免ML流程中的偏见

● 使用特征存储构建实时ML流程

● 通过操纵输入数据来增强现有ML流程

精彩试读

http://www.lryc.cn/news/454262.html

相关文章:

  • Android Framework AMS(01)AMS启动及相关初始化1-4
  • 基于基于微信小程序的社区订餐系统
  • [单master节点k8s部署]29.Istio流量管理(五)
  • Something for 24OI
  • 【React】事件机制
  • 华为OD的职级与薪资
  • 【HTML5】html5开篇基础(4)
  • HTTP【网络】
  • MQ延迟消息:原理、实现与应用
  • 计算机网络—大端序和小端序
  • 《OpenCV 计算机视觉》—— Harris角点检测、SIFT特征检测
  • rtmp协议转websocketflv的去队列积压
  • Elasticsearch实战应用:构建高效搜索引擎
  • Hive数仓操作(四)
  • 《C++跨平台开发:突破界限,释放无限可能》
  • 速盾:免备案服务器?
  • Electron获取nodejs和chrome版本信息
  • 【React】setState 批量更新
  • 微信小程序开发日记第二天
  • 如果您忘记了 Apple ID 和密码,按照指南可重新进入您的设备
  • Top4免费音频剪辑软件大比拼,2024年你选哪一款?
  • 基于SSM的电影院售票系统设计与实现
  • uniapp 必须掌握的细节
  • JavaWeb——Vue组件库Element(3/6):常见组件:Dialog对话框、Form表单(介绍、使用、实际效果)
  • 一个月学会Java 第2天 认识类与对象
  • 【WRF数据准备】MODIS静态地理数据下载及制备
  • MySQL数据库——索引
  • 【SpringCloud】服务注册/服务发现-Eureka
  • 让你的Github Profile高大时尚!
  • ElasticSearch备考 -- Multi match