当前位置: 首页 > news >正文

特征工程——一门提高机器学习性能的艺术

当前围绕人工智能(AI)和机器学习(ML)展开的许多讨论以模型为中心,聚焦于 ML和深度学习(DL)的最新进展。这种模型优先的方法往往对用于训练这些模型的数据关注不足,甚至完全忽视。类似MLOps的领域正迅速发展,通过系统性地训练和利用ML模型,尽量减少人为干预,以“释放”工程师的时间。

许多知名的 AI专家正在敦促数据科学家更关注以数据为中心的机器学习视角,而不是过于关注模型选择和超参数调整过程。这种视角更侧重于提高我们所摄取并用于训练模型的数据质量。

Andrew Ng曾公开表示:“机器学习基本上就是特征工程”,我们需要更加倾向于以数据为中心的方法。我们应该将注意力集中在机器学习流程中最需要细致和谨慎考虑的部分:特征工程

通过“特征工程”技术,可优化训练数据,提升机器学习流程的输出效果!“特征工程”基于现有数据设计相关的输入变量,由此简化训练过程,增强模型性能。调整超参数或模型的效果都不如特征工程;特征工程通过改变数据流程,大幅提升了性能。 

《特征工程训练营》将列举6个实践项目,引导你利用特征工程优化训练数据。每章探讨一个代码驱动的新案例,涉及金融、医疗等行业。你将学会清洗和转换数据,减轻偏见。本书呈现各种性能提升技巧,涵盖从自然语言处理到时间序列分析等所有主要机器学习子领域。

本书主要内容 :

● 识别和实现特征转换
● 用非结构化数据构建ML(机器学习)流程
● 量化并尽量避免ML流程中的偏见
● 使用特征存储构建实时ML流程
● 通过操纵输入数据来增强现有ML流程

http://www.lryc.cn/news/450882.html

相关文章:

  • Paper解读:工作场所人机协作的团队形成:促进组织变革的目标编程模型
  • 图文深入理解Oracle Network配置管理(一)
  • leetcode-链表篇3
  • RAG(Retrieval Augmented Generation)及衍生框架:CRAG、Self-RAG与HyDe的深入探讨
  • C语言介绍
  • 损失函数篇 | YOLOv10 更换损失函数之 MPDIoU | 《2023 一种用于高效准确的边界框回归的损失函数》
  • WMware安装WMware Tools(Linux~Ubuntu)
  • SLAM ORB-SLAM2(30)关键帧跟踪
  • k8s 部署 prometheus
  • 使用VBA快速生成Excel工作表非连续列图片快照
  • 解决GitHub下载速度慢
  • 【机器学习(五)】分类和回归任务-AdaBoost算法
  • 【设计模式-模板】
  • 小程序原生-列表渲染
  • JAVA认识异常
  • 2024年10月计划(工作为主,Ue5独立游戏为辅,)
  • 并发、并行和异步设计
  • 求职Leetcode题目(12)
  • 【YashanDB知识库】如何配置jdbc驱动使getDatabaseProductName()返回Oracle
  • Hadoop三大组件之MapReduce(一)
  • SQL Server 分页查询的学习文章
  • 告别PDF大文件困扰!4款PDF在线压缩工具助你轻松优化!
  • Find My汽车钥匙|苹果Find My技术与钥匙结合,智能防丢,全球定位
  • mysql学习教程,从入门到精通,SQL UNION 运算符(27)
  • PKCE3-PKCE实现(SpringBoot3.0)
  • C++详解vector
  • Redis实战--Redis的数据持久化与搭建Redis主从复制模式和搭建Redis的哨兵模式
  • World of Warcraft [CLASSIC] Engineering 421-440
  • VUE3.5版本解读
  • spark计算引擎-架构和应用