当前位置: 首页 > news >正文

召回-回忆录(持续更新)

0.召回方法

词召回

swing、itemCF

缺点:

  • 有冷启动问题
  • 不是全局召回,冷门活动难以得到召回结果
  • 容易召回过多的头部热门活动

向量召回

参考文献:

经典推荐算法学习(七)| Graph Embedding技术学习 | 从DeepWalk到Node2vec、EGES | 附DeepWalk PySpark实现 - 知乎

经典推荐算法学习(十三)| 常见推荐召回算法梳理 - 知乎

  • FM
  • Item2vec
  • Youtube向量召回
  • Graph Embedding-EGES
  • Airbnb向量召回
  • 双塔召回

问题

1.如何评价召回测

(1)recall、precison、F1

(2)NS-recall、NS-precision、NS-F1:

(3)覆盖率:简单理解,覆盖率就是荐系统能够推荐出来的物品占总物品的比例。由于热门物品占据大量曝光,可能会让很多物品处于不被曝光的状态,这个就是长尾效应。覆盖率是对针对解决长尾效应的一个常用指标。

2.如何摸底召回的上限?

推荐系统中的召回模块决定着推荐效果的上限,那么怎么评价召回模块做好了呢? - 知乎

实际是问召回的评估方法,也可以用下列方法

(1)竟对评估,利用结果倒推召回测问题

(2)随机人工标注数据,从各大平台找到理想结果,然后,回退到召回阶段进行分析

3.召回后续TODO

参考文献:从二值检索到层次竞买图——让搜索广告关键词召回焕然新生

(1)多场景数据融合,比如将搜索和推荐数据进行融合

(2)由于深度学习有可解释性和结果可控性问题,召回通路需要以不同目标进行召回。不同目标的召回通道间,配额需要结合流量价值、用户意图倾向、系统算力等多方面因素进行动态分配,是一个结合更多下游策略来考虑的问题。

(3)我们欢欣鼓舞在各召回通道上迭代模型涨了离线Recall/Hitrate,往往因为指标辛普森悖论、通道间重叠、下游打分偏差等原因,无法为大盘带来明显的竞价集合与效果变化。因此未来关键词召回业务的着力点,将聚焦在全链路排序的目标一致性上。将搜索广告系统看作一个计算图,召回阶段作为最上游的“召回Op”,需要捕捉更多下游“预估Op”、“机制Op”反向传播的“梯度”来动态修正召回阶段的检索能力;扩展更多维度的算法评价指标,为下游供给多样性充分、广告主竞争相对平等的广告集合,为直通车业务的高质量发展添砖加瓦。

(4)召回阶段拟合精排阶段的顺序

http://www.lryc.cn/news/10796.html

相关文章:

  • 1243. 糖果/状态压缩dp【AcWing】
  • 【Spring Cloud Alibaba】001-单体架构与微服务架构
  • Renderer 使用材质分析:materials、sharedMaterials 及 MaterialPropertyBlock
  • java学习----网络编程
  • 这些「误区」99%的研发都踩过
  • Bi系统跟数据中台的区别是什么?
  • 微信小程序反编译方法分享
  • 有了这些接口测试用例+工具,测试效率想不提升都难
  • 麒麟 arm架构安装nginx
  • logrotate失效的排查---selinux开启状态拦截问题及解决方法
  • Allegro使用总结-查看Layout基本操作:
  • cmd del命令笔记
  • apifox持续集成+java+企微机器人+xxljob定时推送
  • 盘点Linux内核网络知识100道题,这篇就够了
  • 数据库敏感字段脱敏
  • skynet 游戏服务器探索(1)--熟悉skynet(网络)
  • select、poll、epoll
  • rollup的基本使用 基本配置与处理各种文件
  • ubuntu-debian系-redhat系
  • Altium Designer 18中原理图DRC编译和PCB DRC检查-AD DRC
  • zipfile — 访问 ZIP 压缩文件
  • 检查nmos管是否损坏
  • 第七章 - 聚合函数(count,avg,sum,max,min)和一些数学函数
  • Typescript的原始据类型和Any类型
  • [python入门㊼] - python类的高级函数
  • 【Windows】使用Fiddler 工具对手机进行接口监听
  • SpringCloudAlibab-nacos
  • 从一致性角度考虑推荐冷启动长尾推荐问题(二)
  • 电脑c盘满了怎么清理,c盘空间清理
  • vite的基本使用