当前位置: 首页 > news >正文

【论文阅读】Decoupled Knowledge Distillation

摘要:最先进的蒸馏方法主要基于从中间层蒸馏出深层特征,而 logit 蒸馏的重要性则被大大忽视了。为了提供研究 logit 蒸馏的新观点,我们将经典的 KD 损失重新表述为两部分,即目标类知识蒸馏 (TCKD) 和非目标类知识蒸馏 (NCKD)。我们实证调查并证明了两部分的效果:TCKD 传递了有关训练样本“困难”的知识,而 NCKD 是 logit 蒸馏起作用的突出原因。更重要的是,我们揭示了经典的 KD 损失是一个耦合公式,它 (1) 抑制了 NCKD 的有效性,并且 (2) 限制了平衡这两个部分的灵活性。为了解决这些问题,我们提出了解耦知识蒸馏 (DKD),使 TCKD 和 NCKD 能够更高效、更灵活地发挥作用。与基于复杂特征的方法相比,我们的 DKD 在 CIFAR-100、ImageNet 和 MS-COCO 数据集上取得了相当甚至更好的结果,并且在图像分类和目标检测任务上具有更好的训练效率。本文证明了 logit 蒸馏的巨大潜力,希望对未来的研究有所帮助。
在这里插入图片描述

参考链接

论文
代码
Decoupled Knowledge Distillation论文阅读+代码解析

http://www.lryc.cn/news/584307.html

相关文章:

  • Spring Boot 整合 RabbitMQ
  • 大语言模型驱动智能语音应答:技术演进与架构革新
  • Java Reference类及其实现类深度解析:原理、源码与性能优化实践
  • 聊一聊 Linux 上对函数进行 Hook 的两种方式
  • 使用EasyExcel动态合并单元格(模板方法)
  • Centos 7下使用C++使用Rdkafka库实现生产者消费者
  • Houdini 分布式解算效率瓶颈突破:渲染 101 云集群实战指南
  • 编程实践:单例模式(懒汉模式+饿汉模式)
  • 面试技术问题总结一
  • android TabLayout 标题栏切换 事件拦截
  • 【Linux系统】冯诺依曼体系结构 | 初识操作系统
  • Redis数据安全性分析
  • Spring Boot快速搭建RESTful应用
  • P1722 矩阵 II 题解 DFS深度优先遍历与卡特兰数(Catalan number)解
  • 【WPF实战】MVVM中如何从数据模型反查自定义控件实例(ImageView + Halcon)
  • C++类对象多态底层原理及扩展问题
  • Zotero+zotmoov+坚果云同步
  • 2023年华为杯研究生数学建模竞赛E题脑卒中临床智能分析
  • 我的世界Java版1.21.4的Fabric模组开发教程(十五)方块实体渲染器
  • 北京一家IPO业绩持续性存疑,关联交易频繁独立性堪忧
  • iOS 抓包详细教程:从零搭建、操作到实战调试的全流程指南
  • C++ -- STL -- vector
  • 北斗舞动在线监测装置:电力安全的“智慧守护者”
  • 大健康IP如何借“合规创新”抢占行业新风口|创客匠人
  • 基于Python的程序员数据分析与可视化系统的设计与实现
  • linxu内核的signal fault和arm内核的flault
  • 网络综合实验
  • Flowable21条件事件------------持续更新中
  • 【LeetCode100】--- 2.字母异位词分组【复习回顾】
  • 【LeetCode 热题 100】148. 排序链表——(解法二)分治