当前位置: 首页 > news >正文

阿里巴巴-淘宝搜索排序算法学习

模型效能:模型结构优化

模型效能:减枝

FLOPS:每秒浮点运算的次数

模型效能:量化

基于统计阈值限定,基于学习阈值限定。

平台效能:一站式DL训练平台

平台效能:搜索模型的系统流程

协同关系:一天全量训练后,把之前流模型训练参数全部覆盖掉,第二天流模型,在批模型的基础上再开始增量训练,基本上就是这么一个模式。
部署完:一次请求后,对5000个doc进行打分,user的特征是一样的,同一个用户,对于用户特征一次运算就可以了。考虑到存储的效率和量化的处理。

系统创新:端云联动的排序系统

端智能:把神经网络部署到用户的手机上,用户的实时行为,非常实时的行为,秒级实时行为,在下次发起请求之前,没办法利用实时,所以要部署到手机端上。
用户产生的细粒度的数据量是非常大的,不太适合全部上传到云上面,比较敏感的用户信息。
在用户不断的曝光点击,这样的下滑浏览的过程中,感知用户个性化行为,从而对手机上缓冲池中,未曝光的商品排序进行一个更新。

搜索推荐(Search Recommendation)是指在用户搜索过程中,系统根据用户的搜索历史、浏览历史、搜索关键词等因素,提供相关的搜索建议和推荐结果。这些推荐结果可以帮助用户快速找到所需的信息,提高用户体验。
SRP行为(Search Result Page behavior)是指用户在搜索结果页面(Search Result Page, SRP)上的行为,例如点击搜索结果、滚动页面等。这些行为可以作为反馈,帮助搜索引擎优化搜索结果的排序和推荐。

端上排序模型设计

名称解释

PointWise:PointWise对单个特征排序打分
ListWise: 对一组特征排序打分
GAUC(Gini normalized Area Under the ROC Curve):是在广告点击率预测中广泛使用的一种性能度量标准。 它通过对预测结果排序并计算ROC曲线下的面积来衡量分类器的性能。
CTR_GAUC:CTR_GAUC指的则是根据GAUC进行加权处理得到的用于评估广告点击率预测模型性能的指标,通常用于评估线上广告推荐系统的性能。它同时考虑到CTR和GAUC,以CTR为权重对GAUC进行加权平均计算,能够更全面地反映广告推荐模型的性能(来自CHAT_GPT的解答)

要点

在端上格式转化后,存储量更低

参考资料

https://www.bilibili.com/video/BV1QS4y1j7yK/?spm_id_from=333.337.search-card.all.click (淘宝搜索排序算法)

http://www.lryc.cn/news/59265.html

相关文章:

  • 〖Python网络爬虫实战⑮〗- pyquery的使用
  • SQL综合查询下
  • 全连接层FC
  • 图的遍历及连通性
  • DJ3-4 实时调度
  • Oracle之PL/SQL游标练习题(三)
  • docker运行服务端性能监控系统Prometheus和数据分析系统Grafana
  • 【Linux】【应用层】多线程编程
  • GameFramework 框架详解之 如何接入热更框架HybridCLR
  • 全国青少年软件编程(Scratch)等级考试二级考试真题2023年3月——持续更新.....
  • HTML2.1列表标签
  • 在 Flutter 多人视频通话中实现虚拟背景、美颜与空间音效
  • Ambari-web 架构
  • 对接百思买Best Buy EDI 的注意事项
  • 2023年郑州重点建设项目名单公布,中创“算力数据中心”项目入选!
  • Pytorch 容器 - 1. Module类介绍
  • 百度墨卡托坐标转化笔记
  • 每日学术速递4.12
  • HarmonyOS/OpenHarmony公司级技术开发团队硬件基本配置清单
  • 新一代信息技术赋能,安科瑞搭建智慧水务体系的新思路
  • 37岁测试工程师被裁,120天没找到工作,无奈...
  • Java容器使用注意点
  • 密文题解(图论+字典树)
  • Baumer工业相机堡盟工业相机如何通过BGAPISDK里的工具函数来计算工业相机的实时帧率(C#)
  • 数据结构与常量(Java)
  • 【LeetCode】剑指 Offer 54. 二叉搜索树的第k大节点 p269 -- Java Version
  • [工具类] post请求 获取request对象, 获取request的请求体(body)参数
  • Golang 多版本安装小工具G
  • day29—选择题
  • day8 互斥锁/读写锁的概念及使用、死锁的避免