当前位置: 首页 > news >正文

机器学习第五课--广告点击率预测项目以及特征选择的介绍

这个项目的主要的目的是通过给定的广告信息和用户信息来预测一个广告被点击与否。 如果广告有很大概率被点击就展示广告,如果概率低,就不展示。 因为如果广告没有被点击,对双方(广告主、平台)来讲都没有好处。所以预测这个概率非常重要,也是此项目的目标。

在这个项目中,你需要完成以下的任务:

1.数据的读取和理解: 把给定的.csv文件读入到内存,并通过pandas做数据方面的统计以及可视化来更深入地理解数据。

2.特征构造: 从原始特征中衍生出一些新的特征,这部分在机器学习领域也是很重要的工作。

3.特征的转化: 特征一般分为连续型(continuous)和类别型(categorical), 需要分别做不同的处理。

4.特征选择: 从已有的特征中选择合适的特征,这部分也是很多项目中必不可少的部分。

5.模型训练与评估: 通过交叉验证方式来训练模型,这里需要涉及到网格搜索等技术。

特征选择 

防止过拟合,以及噪声 

1.尝试所有的组合---能够得到全局最优解

2.贪心算法

f4最好,就放进去,然后再放另外的,反复用贪心算法加进去

3.L1正则

有缺点,有不可导的点

4.树算法(决策树)

根节点最好,接着是下一层,再下一层

5.相关性计算

和最终目标相关性越大,越好

超参数的搜索 

1.网格搜索--遍历

给定超参数的取值范围进行搜索

2.启发式搜索

启发式是有一个点很好,就在他周围找,要是不好,就不在他的周围找了。

http://www.lryc.cn/news/172858.html

相关文章:

  • 细说tcpdump的妙用
  • 【深度学习实验】前馈神经网络(七):批量加载数据(直接加载数据→定义类封装数据)
  • 气体放电模拟装置中1Pa~101kPa范围内的真空度控制技术
  • 华为OD机试 - 构成正方形的数量 - 数据结构map(Java 2023 B卷 100分)
  • sql on条件判断是要注意null值
  • 9.22(一):数组扁平化
  • 【vue2第十九章】手动修改ESlint错误 和 配置自动化修改ESlint错误
  • 计算机网络常见面试题
  • springboot整合MeiliSearch轻量级搜索引擎
  • 禁用鼠标的侧边按键
  • 【C语言】数组和指针刷题练习
  • 2023年中国研究生数学建模竞赛D题解题思路
  • 在编译源码的环境下,搭建起Discuz!社区论坛和WordPress博客的LNMP架构
  • 腾讯面试题:无网络环境,如何部署Docker镜像?
  • 医学影像信息(PACS)系统软件源码
  • 【01】FISCOBCOS的系统环境安装
  • flutter 权限和图片权限之前的冲突
  • OpenCV(四十八):读取视频和保存视频
  • 如何在react/next.js app中的同级组件间传递数据
  • 软件需求文档、设计文档、开发文档、运维文档大全
  • 排序算法-----归并排序
  • docker 配置 gpu版pytorch环境--部署缺陷检测--Anomalib
  • 为什么定时发朋友圈会更有效呢?
  • 【跟小嘉学 PHP 程序设计】一、PHP 开发环境搭建
  • 【zookeeper】zk选举、使用与三种节点简介,以及基于redis分布式锁的缺点的讨论
  • Unity截图生成图片 图片生成器 一键生成图片
  • Matlab图像处理-区域特征
  • golang 自动生成文件头
  • Excel中的宏、VBA
  • 2023华为杯数学建模研赛思路分享——最全版本A题深度解析