当前位置: 首页 > news >正文

每日学术速递2.27

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理 

Subjects: cs.CL

1.FiTs: Fine-grained Two-stage Training for Knowledge-aware Question Answering

标题:FiTs:用于知识感知问答的细粒度两阶段训练

作者:Qichen Ye, Bowen Cao, Nuo Chen, Weiyuan Xu, Yuexian Zou

文章链接:https://arxiv.org/abs/2302.11799v1

项目代码:https://github.com/yeeeqichen/fits

摘要:

        视觉知识感知问答 (Knowledge-aware question answering, KAQA) 要求模型通过知识库回答问题,这对于开放域 QA 和特定域 QA 都是必不可少的,尤其是当仅靠语言模型无法提供所需的所有知识时。尽管最近的 KAQA 系统倾向于整合来自预训练语言模型 (PLM) 的语言知识和来自知识图 (KG) 的事实知识来回答复杂问题,但在有效融合来自 PLM 和 KG 的表征方面存在瓶颈,因为(i) 它们之间的语义和分布差距,以及 (ii) 对两种模式提供的知识进行联合推理的困难。为了解决上述两个问题,我们提出了一个细粒度的两阶段训练框架(FiTs)来提高 KAQA 系统的性能:第一阶段旨在对齐来自 PLM 和 KG 的表示,从而弥合它们之间的模态差距,命名为知识自适应后训练。第二阶段称为知识感知微调,旨在提高模型基于对齐表示的联合推理能力。详细地说,除了 QA 监督之外,我们还通过两个辅助的自我监督任务对训练后模型进行了微调。大量实验表明,我们的方法在常识推理(即 CommonsenseQA、OpenbookQA)和医学问答(即 MedQA-USMILE)领域的三个基准测试中实现了最先进的性能。

2.Exploring Social Media for Early Detection of Depression in COVID-19 Patients

标题:探索社交媒体以早期发现 COVID-19 患者的抑郁症

作者:Jiageng Wu, Xian Wu, Yining Hua, Shixu Lin, Yefeng Zheng, Jie Yang

文章链接:https://arxiv.org/abs/2302.12044v1

项目代码:https://github.com/dragon-wu/depcov-www2023

摘要:

        COVID-19 大流行对全球健康造成了重大损害。尽管三年过去了,世界仍在与病毒作斗争。人们越来越担心 COVID-19 对受感染者心理健康的影响,这些人更容易患抑郁症,这可能对受影响的个人和整个世界产生长期影响。早期检测和干预可以降低 COVID-19 患者患抑郁症的风险。在本文中,我们通过社交媒体分析调查了 COVID-19 感染与抑郁症之间的关系。首先,我们管理了一个 COVID-19 患者的数据集,其中包含有关他们感染前后社交媒体活动的信息。其次,我们对该数据集进行了广泛的分析,以调查具有较高抑郁风险的 COVID-19 患者的特征。第三,我们提出了一种用于早期预测抑郁症风险的深度神经网络。该模型将日常情绪波动视为一种精神信号,并通过知识蒸馏结合文本和情感特征。实验结果表明,我们提出的框架在检测抑郁症风险方面优于基线,AUROC 为 0.9317,AUPRC 为 0.8116。我们的模型有可能使公共卫生组织能够对高危患者进行及时干预

Subjects: cs.CV

3.Region-Aware Diffusion for Zero-shot Text-driven Image Editing

标题:用于零样本文本驱动图像编辑的区域感知扩散

作者:Nisha Huang, Fan Tang, WeiMing Dong, Tong-Yee Lee, Changsheng Xu

文章链接:https://arxiv.org/abs/2302.11797v1

项目代码:https://github.com/haha-lisa/RDM-Region-Aware-Diffusion-Model

摘要:

        在文本描述的指导下进行图像处理最近受到了广泛的关注。在这项研究中,我们专注于在给定文本提示的指导下对图像进行区域编辑。与当前基于掩码的图像编辑方法不同,我们提出了一种用于实体级图像编辑的新型区域感知扩散模型 (RDM),它可以自动定位感兴趣的区域并根据给定的文本提示替换它。为了在图像保真度和推理速度之间取得平衡,我们通过结合潜在空间扩散和增强方向引导来设计密集扩散管道。此外,为了保留非编辑区域的图像内容,我们引入了区域感知实体编辑来修改感兴趣区域并保留非感兴趣区域。我们通过广泛的定性和定量实验验证了超出基线方法的拟议 RDM。结果表明,RDM 在视觉质量、整体协调性、非编辑区域内容保留和文本图像语义一致性方面优于以前的方法。这些代码可在 https://github.com/haha-lisa/RDM-Region-Aware-Diffusion-Model 获得。

更多Ai资讯:公主号AiCharm
在这里插入图片描述

http://www.lryc.cn/news/22114.html

相关文章:

  • 【数据库系统概论】基础知识总结
  • 简单移动平均在量化中的应用(附Python实战代码)
  • ChatGPT提高你日常工作的五个特点,以及如何使用它来提高代码质量
  • spark datasourceV1和v2
  • 10种聚类算法的完整python操作示例
  • 构建合作伙伴生态系统刻不容缓
  • 剑指 Offer 55 - I. 二叉树的深度(java解题)
  • 威胁行为者将旧漏洞武器化以发起勒索软件攻击
  • 2023北京健博会/第十届中国国际大健康产博览会
  • Python学习笔记之环境搭建
  • 死锁的总结
  • 强化学习RL 01~ 数学基础
  • Java的运算符
  • 扫地机器人(蓝桥杯C/C++)
  • 如何理解API?API 是如何工作的?(5分钟诠释)
  • PAT--1111 对称日
  • 前端纯函数和副作用概念,且在react上的体现详解
  • 转行软件测试3年了,听前辈说测试前途是IT里最low的,我慌了......
  • CNI 网络流量 5.1 Cilium 介绍和原理
  • 机加行业MES解决方案,助力企业打造数字化透明车间
  • C/C++每日一练(20230227)
  • 总结SpringBoot1.x迁移到2.x需要注意的问题
  • Api接口小知识
  • 「JVM 高效并发」Java 协程
  • Web Spider案例 网洛者 第一题 JS混淆加密 - 反hook操作 练习(五)
  • 前端基础之CSS扫盲
  • mysql组复制、mysql路由器、mysql的MHA高可用
  • 一篇搞懂springboot多数据源
  • Verilog 数据类型和数组简介
  • 【数据结构】时间复杂度和空间复杂度以及相关OJ题的详解分析