当前位置: 首页 > news >正文

论文阅读笔记|大规模多标签文本分类

多标签文本分类(Extreme Multi Label Classification, MLTC)是自然语言处理领域中一个十分重要的任务,其旨在从一个给定的标签集合中选取出与文本相关的若干个标签。MLTC可以广泛应用于网页标注,话题识别和情感分析等场景。大规模标签分类特点在于标签集规模较大,且标签之间可能存在从属或包含关系,这种情况下的分类不同于一般的二分类或十分类等标签互斥的分类,由于标签之间关系的复杂性,此问题有较好的研究价值,在搜索或推荐系统中也有较高的应用价值。

目录

  • 方法汇总
  • 评价指标
  • 相关文献


方法汇总

  • 1-vs-all:把多标签分类看作是二分类问题
  • label-tree-based:类似决策树
  • embedding-based:将最后一层特征维度先映射到比较小的维度上,减少参数量
  • deep-learning-based:(1)看成seq2seq任务,一步步生成标签直到end。这时标签集被看作是一个词库,添加了 和
  • discriminative learning-based:先把文本处理成一个向量,再用概率标签树得到最终的概率。(个人理解:是不是只要达到某个阈值就判定当前文本属于此标签)
  • 还有一些将上述方法结合的工作

评价指标

预测准确率 & 命中率


相关文献

  • AttentionXML: Label Tree-based Attention-Aware Deep Model for High-Performance Extreme Multi-Label Text Classification(NIPS, 2019)
  • Deep Extreme Multi-label Learning(ICMR, 2018)
  • Hierarchical Text Classification with Reinforced Label Assignment(EMNLP, 2019)
  • Multi-modal Extreme Classification(CVPR, 2022)
  • Contrastive Learning-Enhanced Nearest Neighbor Mechanism for MLTC(ACL, 2022)
    主要思想:使用对比学习增强多标签文本分类中的k近邻机制,将对比学习和kNN聚类融入到分类过程中

在这里插入图片描述

一个神奇的网站:Reinforced Label Assignment The Extreme Classification Repository,包含多个大规模多标签文本分类模型的介简介及其相关代码。


参考资料

  1. 大规模多标签分类 - 知乎 (zhihu.com)
  2. 多标签学习的新趋势(2021 Survey TPAMI) - 知乎 (zhihu.com)
http://www.lryc.cn/news/37478.html

相关文章:

  • 国际化翻译navigator.language与语种对照表
  • Matlab进阶绘图第6期—雷达图/蜘蛛图/星图
  • Javascript的ES6 class写法和ES5闭包写法性能对比
  • 探秘MySQL——全面了解索引、索引优化规则
  • 战斗力最强排行榜:10-30人团队任务管理工具
  • 2023-03-09干活小计
  • 基数排序算法
  • 项目实战典型案例24——xxljob控制台不打印日志排查
  • 旋转框目标检测mmrotate v1.0.0rc1 之RTMDet训练DOTA的官方问题解析整理(四)
  • 4个顶级的华为/小米/OPPO/Vivo手机屏幕解锁工具软件
  • 华为OD机试题 - 和最大子矩阵(JavaScript)| 机考必刷
  • 企业电子招标采购系统源码之项目说明和开发类型
  • Python高频面试题——装饰器(带大家理解装饰器的本质)
  • 全方位解读智能中控屏发展趋势!亚马逊Alexa语音+Matter能力成必备
  • JAVA练习74-括号生成
  • Java ORM开发 更全面的应用场景
  • SpringBoot【基础篇】---- 基础配置
  • 手机磁吸背夹散热器制冷快速方案
  • 青岛OJ(QingdaoU/OnlineJudge)部署如何直连数据库批量修改
  • 渗透测试——信息收集(详细)
  • 什么是谐波
  • 技术报告:程序员如何开发一个商城型购物网站
  • DPDK系列之八虚拟化virtio
  • 直播间与2位优秀创作者分享经历
  • linux上快速安装 Flarum 指南
  • 数学不好,英语不行,非本专业,可以学IT吗?
  • 软件测试13
  • React(八):引出Hook、useState、useEffect的使用详解
  • 32*4VKL128 LQFP44超低功耗/超低工作电流/抗干扰LCD液晶段码驱动IC/LCD驱动芯片(IC) 适用于激光/红外线测距仪
  • 自定义控件(?/N) - 事件分发