当前位置: 首页 > news >正文

每日学术速递3.7

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理 

Subjects: cs.CV

1.Dropout Reduces Underfitting

标题:Dropout 减少欠拟合

作者:Zhuang Liu, Zhiqiu Xu, Joseph Jin, Zhiqiang Shen, Trevor Darrel

文章链接:https://arxiv.org/abs/2303.01500v1

项目代码:https://github.com/facebookresearch/dropout

摘要:

        由 Hinton 等人介绍。2012 年,dropout 作为防止神经网络过度拟合的正则化项经受住了时间的考验。在这项研究中,我们证明了在训练开始时使用 dropout 也可以减轻欠拟合。在早期阶段,我们发现 dropout 减少了小批量梯度的方向方差,并有助于将小批量梯度与整个数据集的梯度对齐。这有助于抵消 SGD 的随机性并限制个别批次对模型训练的影响。我们的发现使我们找到了一种提高欠拟合模型性能的解决方案——早期退出:退出仅在训练的初始阶段应用,然后关闭。与没有 dropout 的模型相比,配备了 early dropout 的模型实现了更低的最终训练损失。此外,我们探索了一种用于正则化过拟合模型的对称技术 - 后期退出,其中退出在早期迭代中不使用,仅在后期训练中激活。在 ImageNet 和各种视觉任务上进行的实验表明,我们的方法不断提高泛化精度。我们的结果鼓励更多关于理解深度学习正则化的研究,我们的方法可以成为未来神经网络训练的有用工具,尤其是在大数据时代。

2.Self-Supervised Few-Shot Learning for Ischemic Stroke Lesion Segmentation

标题:用于缺血性中风病灶分割的自监督小样本学习

作者:Luca Tomasetti, Stine Hansen, Mahdieh Khanmohammadi, Kjersti Engan, Liv Jorunn Høllesli, Kathinka Dæhli Kurz, Michael Kampffmeyer

文章链接:https://arxiv.org/abs/2303.01332v1

项目代码:https://github.com/biomedical-data-analysis-laboratory/adnet-for-ais-segmentation

摘要:

        精确的缺血性病灶分割在改善缺血性中风的诊断和治疗计划方面起着至关重要的作用,缺血性中风是死亡率最高的流行病之一。虽然最近提出了许多深度神经网络方法来解决这个问题,但这些方法在训练过程中需要大量的注释区域,这在注释数据稀缺的医学领域是不切实际的。作为一种补救措施,我们提出了一种原型的少镜头分割方法,用于在训练期间仅使用一个带注释的样本进行缺血性病变分割。所提出的方法利用了一种新颖的自我监督训练机制,该机制通过利用从计算机断层扫描灌注扫描生成的颜色编码参数图来适应缺血性中风病变分割的任务。我们说明了我们提出的训练机制的好处,从而在少镜头设置中显着提高了性能。给定一个带注释的患者,缺血性病变分割的平均 Dice 得分为 0.58。

3.The Learnable Typewriter: A Generative Approach to Text Line Analysis

标题:基于匹配的术语语义预训练,用于理解患者的口语查询

作者:Zefa Hu, Xiuyi Chen, Haoran Wu, Minglun Han, Ziyi Ni, Jing Shi, Shuang Xu, Bo Xu

文章链接:https://arxiv.org/abs/2303.01341v1

项目代码:https://github.com/flyingcat-fa/tspmn

摘要:

        Medical Slot Filling (MSF) 任务旨在将医疗查询转换为结构化信息,在诊断对话系统中发挥重要作用。然而,缺乏足够的术语语义学习使得现有方法难以捕捉医学对话中语义相同但口语化的术语表达。在这项工作中,我们将 MSF 形式化为一个匹配问题,并提出了一个术语语义预训练匹配网络 (TSPMN),它将术语和查询作为输入来模拟它们的语义交互。为了更好地学习术语语义,我们进一步设计了两个自监督目标,包括对比术语识别(CTD)和基于匹配的掩码术语建模(MMTM)。CTD 判断每个给定的term 是否是对话中的masked term,而MMTM 直接预测masked 的。两个中国基准的实验结果表明,TSPMN 优于强基线,尤其是在少镜头设置中。

更多Ai资讯:公主号AiCharm
在这里插入图片描述

http://www.lryc.cn/news/32675.html

相关文章:

  • 灯具照明行业MES系统,助力企业实现数字化转型
  • 超实用!JavaScript修改CSS变量,达到动态修改样式的目的
  • 解决Vue3 默认槽的非函数值 - Non-function value encountered for default slot 的警告
  • 【Git】P2 分支(创建分支,合并分支,分支冲突,分支分类)
  • 2023年全国最新交安安全员精选真题及答案14
  • Air101|Air103|Air105|Air780E|ESP32C3|ESP32S3|Air32F103开发板:概述及PinOut
  • 【代码随想录训练营】【Day35】第八章|贪心算法|860.柠檬水找零|406.根据身高重建队列|452. 用最少数量的箭引爆气球
  • 嵌入式C基础知识(23)
  • 一文掌握组织项目等级划分维度,标准和实例
  • 【C++】list的使用和基本迭代器框架的实现 vs和g++下string结构的说明
  • 基于深度学习的轴承寿命预测实践,开发CNN、融合LSTM/GRU/ATTENTION
  • redis进阶:mysql,redis双写一致性,数据库更新后再删除缓存就够了吗?
  • RTOS中互斥量的原理以及应用
  • 数据分析:基于随机森林(RFC)对酒店预订分析预测
  • 【python】序列(列表、元组)、字典、集合的初步认识
  • 周赛335(模拟、质因子分解、分组背包)
  • 【极致简洁】Python tkinter 实现下载工具,你想要的一键获取
  • npm i 安装报错
  • 原腾讯QQ空间负责人,T13专家,黄希彤被爆近期被裁员,裁员原因令人唏嘘。。...
  • 【C++】BloomFilter——布隆过滤器
  • 【Spring】资源操作管理:Resource、ResourceLoader、ResourceLoaderAware;
  • 【System Verilog基础】automatic自动存储--用堆栈区存储局部变量
  • 看板组件:Bryntum Task Board JS 5.3.0 Crack
  • 45 个 Git 经典操作场景,专治不会合代码
  • MyBatis之动态SQL
  • SpringBoot(Tedu)—DAY01——环境搭建
  • 代理模式-大话设计模式
  • STM32定时器的编码器接口模式
  • Java方法的使用
  • Linux命令·nl