当前位置: 首页 > news >正文

STARnak, LTR 模型笔记

未完成.

1. 简述

CIKM '23 的一篇论文, 任务为 Learning To Rank, 输入为 候选集合, 输出为 有序列表, 用于 top-n 推荐场景.

思考:

  1. 它是要替代 ctr 预估么?
  2. 它跟 mind 这种召回, 有啥大的不一样么?

2. 网络结构

  • u u u: 将用户(或 query) 记为 u
  • H q = d X , d Y , . . . Hq = {d_X,d_Y,...} Hq=dX,dY,..., 该用户的历史交互序列.
  • D q = d A , d B , . . . Dq = {d_A,d_B,...} Dq=dA,dB,..., 候选的商品集合.
  • π \pi π, 生成的商品排列.
    在这里插入图片描述
    图. illustration of STARank

2.1 Arranger Module

  1. 前序为 ReaderModule, 使用 LSTM 将 u 与 Hq 作有序的编码, 得到 u q u_q uq.
  2. 类似于 self-attention, 商品 d 与 u q u_q uq 交互后得到商品的向量 h d h_d hd.
  3. 然后开始做排列. 见下截图, s d i = f ( h d , u 1 , p i ) s_d^i=f(h_d,u_1,p_i) sdi=f(hd,u1,pi), 建模 位置与 u_q 信息. 并使用 soft-max 得到概率.
    在这里插入图片描述Q: 如何令 π i \pi_i πi 感知到 π < i \pi_{<i} π<i 的前序排列的信息呢?

Plackett Luce (PL) module .

2.2 loss

3. 基线对比

http://www.lryc.cn/news/460612.html

相关文章:

  • 【数据结构】:破译排序算法--数字世界的秩序密码(二)
  • 2024年《生成式ai大模型》都学什么内容呢?
  • kubernetes自定义pod启动用户
  • C4T避风型电动采光排烟天窗(图集09J621-2)
  • 多态常见面试问题
  • 案例-登录认证(上)
  • 对BSV区块链下一代节点Teranode的答疑解惑(上篇)
  • vue父子组件传参的方法
  • 关于this指针
  • 机器学习西瓜书
  • 如何使用 Puppeteer 和 Browserless 运行自动化测试?
  • python菜鸟知识
  • GPT4o,GPTo1-preview, 拼
  • 论文笔记:Pre-training to Match for Unified Low-shot Relation Extraction
  • 一篇文章带你快速了解linux中关于信号的核心内容
  • openEuler、Linux操作系统常见操作-(6)如何登录Linux
  • Python基础语法条件
  • 006-MAVEN 的使用
  • npm使用时报错:Could not retrieve https://npm.taobao.org/mirrors/node/index.json.
  • 软考中级网络工程师——高级配置
  • Leetcode 第 141 场双周赛题解
  • Linux性能调优,还可以从这些方面入手
  • STM32的独立看门狗定时器(IWDG)技术介绍
  • 自动化生成工作流?英伟达提出ComfyGen:通过LLM来匹配给定的文本提示与合适的工作流程
  • indicatorTree-v10练习(有问题)
  • python源码:指定麦克风/音响播放歌曲
  • 基于华为云智慧生活生态链设计的智能鱼缸
  • OJ-1015图像物体的边界
  • RAG 入门实践:从文档拆分到向量数据库与问答构建
  • 445: 选择问题