当前位置: 首页 > news >正文

生成式召回-TIGER范式

TIGER(Transformer Index for GEnerative Recommenders)是生成式召回的经典力作,其核心思想就是语义ID+Seq2Seq,这一范式启发了后续大量生成式推荐工作。

📌 背景与痛点

item id是商品在候选库中的独特标识,其具有高度稀疏性,且没有任何物理含义,对于模型训练、新品冷启、可解释性都极不友好。假设一个item的side info足够多,可以完整刻画该item的属性,那么item id完全是可以舍弃的。

TIGER利用多个语义id来表征该item,极大地减少了id embedding词表空间,对工业界生产环境友好;通过模型结构共享相似item的语义信息,提升模型泛化性,利好新品冷启。

✅ TIGER 解决的痛点和优势

痛点TIGER 的解决方法优势
embedding 太大 / 存储高Semantic ID token 数量极小,token vocabulary 可控制内存友好、减小表规模
冷启动 item embedding 缺失Semantic ID 来源于 item 内容特征可推广至新 item,无需训练 embedding
类似 item 无共享相似内容生成相近的 Semantic ID用户语义共享,加强泛化
模型检索复杂Transformer decoder 直接生成端到端简洁流程

🧠 核心创新点

Semantic ID表示

语义id

  • 使用内容编码(如 SentenceT5)生成 item embedding
  • 将embedding经RQ-VAE量化为一系列codeword Tuple,即 Semantic ID
  • 各token具有语义信息,编码符号总量远小于item总量

生成式检索(Generative Retrieval)

seq2seq

通过自回归解码生成目标item id,而不是传统embedding + ANN。Transformer的decoder直接输出item的Semantic ID作为推荐结果。

实验结果

exp
别看实验结果相对值提升很大,很唬人,其实绝对值提升很小。但TIGER范式建模确是一个极大的创新,为生成式推荐打开了思路。

🧾 总结

  • TIGER是第一篇将 Generative Retrieval 自回归生成方式 应用于推荐系统的工作;
  • 它通过Semantic ID 和 Seq2Seq Transformer,突破embedding + ANN的传统限制;
  • 冷启动、多样性、效率和泛化能力上展现强优势;
  • 适用于大规模推荐场景,尤其是content-rich、item海量、频繁上线新品的平台。

参考

  • Recommender Systems with Generative Retrieval
  • 【谷歌2023】TIGER:基于生成式召回的推荐系统
  • NIPS‘23「谷歌」语义ID|TIGER:Recommender Systems with Generative Retrieval
http://www.lryc.cn/news/601836.html

相关文章:

  • BUG记录——Request接传Json数据中文乱码
  • C语言——————学习笔记(自己看)
  • Oracle 19C RU 19.28 升级和安装
  • Frontiers in Psychology投稿LaTeX(三)
  • Python异常处理:金融风控系统中的救命盾牌
  • 设备分配与回收
  • 6.Pinia快速入门
  • 3.JDK+JRE组件构成与协作
  • LeetCode 刷题【16. 最接近的三数之和、17. 电话号码的字母组合】
  • 推荐系统学习
  • 电子电路设计学习
  • Oracle数据库常用语法详解
  • 逆向入门(43)程序逆向篇-tsrh-crackme
  • C++ auto 类型推导
  • Android MQTT 长连接最佳实践技术分享
  • 5.4 ASPICE适配过程中的实施改进
  • 机械学习初识--什么是机械学习--机械学习有什么重要算法
  • Red靶机攻略
  • 字符串是数据结构还是数据类型?
  • Day44 Java数组08 冒泡排序
  • python中的容器与自定义容器
  • Pinocchio 结合 CasADi 进行 IK 逆运动学及 Mujoco 仿真
  • 09_opencv_遍历操作图像像素
  • CIFAR100数据集实测-基于 AlexNet模型的压缩/Bagging/Boosting 探索
  • 人社部物联网安装调试员的实训平台
  • 深度学习(鱼书)day04--手写数字识别项目实战
  • 网络协议:计算机世界的“交通规则“与“社交礼仪“
  • java--WebSocket简单介绍
  • Flutter开发实战之性能优化与调试
  • 深入解析MIPI C-PHY (四)C-PHY物理层对应的上层协议的深度解析