当前位置: 首页 > news >正文

每日一题33:数据统计之广告效果

一、每日一题

返回结果示例如下:

示例 1:

输入:
Ads 表:
+-------+---------+---------+
| ad_id | user_id | action  |
+-------+---------+---------+
| 1     | 1       | Clicked |
| 2     | 2       | Clicked |
| 3     | 3       | Viewed  |
| 5     | 5       | Ignored |
| 1     | 7       | Ignored |
| 2     | 7       | Viewed  |
| 3     | 5       | Clicked |
| 1     | 4       | Viewed  |
| 2     | 11      | Viewed  |
| 1     | 2       | Clicked |
+-------+---------+---------+
输出:
+-------+-------+
| ad_id | ctr   |
+-------+-------+
| 1     | 66.67 |
| 3     | 50.00 |
| 2     | 33.33 |
| 5     | 0.00  |
+-------+-------+
解释:
对于 ad_id = 1, ctr = (2/(2+1)) * 100 = 66.67
对于 ad_id = 2, ctr = (1/(1+2)) * 100 = 33.33
对于 ad_id = 3, ctr = (1/(1+1)) * 100 = 50.00
对于 ad_id = 5, ctr = 0.00, 注意 ad_id = 5 没有被点击 (Clicked) 或查看 (Viewed) 过
注意我们不关心 action 为 Ingnored 的广告

解答:

import pandas as pddef ads_performance(ads_df: pd.DataFrame) -> pd.DataFrame:
# 过滤掉 Ignored 行filtered_df = ads_df[ads_df['action'] != 'Ignored']# 计算每个 ad_id 的点击次数和查看次数summary = filtered_df.groupby(['ad_id', 'action']).size().unstack(fill_value=0)# 确保有 Clicked 和 Viewed 列,如果不存在则创建并填充为0summary['Clicked'] = summary.get('Clicked', 0)summary['Viewed'] = summary.get('Viewed', 0)
# 计算CTRsummary['CTR'] = (summary['Clicked'] / (summary['Clicked'] + summary['Viewed'])).fillna(0) * 100# 处理没有被点击或查看的广告,赋值为0full_ad_ids = ads_df['ad_id'].unique()ctr_df = summary.reindex(full_ad_ids, fill_value = 0).reset_index()ctr_df['CTR'] = ctr_df['CTR'].fillna(0).round(2)# 排序,按CTR降序和ad_id升序排序ctr_df = ctr_df.sort_values(by = ['CTR', 'ad_id'], ascending = [False, True])[['ad_id', 'CTR']]return ctr_df# 测试代码
data = {'ad_id': [1, 2, 3, 5, 1, 2, 3, 1, 2, 1],'user_id': [1, 2, 3, 5, 7, 7, 5, 4, 11, 2],'action': ['Clicked', 'Clicked', 'Viewed', 'Ignored', 'Ignored', 'Viewed', 'Clicked', 'Viewed', 'Viewed', 'Clicked']
}
ads_df = pd.DataFrame(data)result = ads_performance(ads_df)
print(result)

二、总结

注意分母为0的情况时如何处理。

http://www.lryc.cn/news/362839.html

相关文章:

  • 52、有边数限制的最短路
  • Spring boot实现基于注解的aop面向切面编程
  • MySQL之查询性能优化(四)
  • 定时任务详解
  • OnlyOffice DocumentServer 8.0.1编译破解版本(¥100)
  • Android 应用权限
  • MATLAB 匿名函数
  • Java 新手入门:基础知识点一览
  • 三维模型轻量化工具:手工模型、BIM、倾斜摄影等皆可用!
  • 小程序CI/CD之自动化打包预览并钉钉通知发布进程
  • C++使用QtHttpServer开发服务端Server的Http POST接口和客户端Client示例
  • 计算机基础(8)——音频数字化(模电与数电)
  • 手搓单链表(无哨兵位)(C语言)
  • 代码随想录算法训练营第18天|二叉树
  • 使用tftpd更新开发板内核
  • MySQL数据库整体知识点简述
  • 深入理解MySQL索引下推优化
  • 论文降重技巧:AI工具如何助力论文原创性提升?
  • el-date-picker的使用,及解决切换type时面板样式错乱问题
  • Flutter 中的 ToggleButtonsTheme 小部件:全面指南
  • 新手教程之使用LLaMa-Factory微调LLaMa3
  • Java函数笔记
  • Maven实战: 从工程创建自定义archetype
  • 初识JAVA中的包装类,时间复杂度及空间复杂度
  • RapidMiner如何利用Hugging Face中的模型实现更有趣的事
  • Vue3 自定义Hooks函数的封装
  • python的DataFrame和Series
  • ARP欺骗的原理与详细步骤
  • 25、DHCP FTP
  • spark学习记录-spark基础概念