当前位置：首页 > news >正文

每日学术速递2.27

news 2025/7/28 20:53:54

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理

Subjects: cs.CL

1.FiTs: Fine-grained Two-stage Training for Knowledge-aware Question Answering

标题：FiTs：用于知识感知问答的细粒度两阶段训练

作者：Qichen Ye, Bowen Cao, Nuo Chen, Weiyuan Xu, Yuexian Zou

文章链接：https://arxiv.org/abs/2302.11799v1

项目代码：https://github.com/yeeeqichen/fits

摘要：

视觉知识感知问答 (Knowledge-aware question answering, KAQA) 要求模型通过知识库回答问题，这对于开放域 QA 和特定域 QA 都是必不可少的，尤其是当仅靠语言模型无法提供所需的所有知识时。尽管最近的 KAQA 系统倾向于整合来自预训练语言模型 (PLM) 的语言知识和来自知识图 (KG) 的事实知识来回答复杂问题，但在有效融合来自 PLM 和 KG 的表征方面存在瓶颈，因为(i) 它们之间的语义和分布差距，以及 (ii) 对两种模式提供的知识进行联合推理的困难。为了解决上述两个问题，我们提出了一个细粒度的两阶段训练框架（FiTs）来提高 KAQA 系统的性能：第一阶段旨在对齐来自 PLM 和 KG 的表示，从而弥合它们之间的模态差距，命名为知识自适应后训练。第二阶段称为知识感知微调，旨在提高模型基于对齐表示的联合推理能力。详细地说，除了 QA 监督之外，我们还通过两个辅助的自我监督任务对训练后模型进行了微调。大量实验表明，我们的方法在常识推理（即 CommonsenseQA、OpenbookQA）和医学问答（即 MedQA-USMILE）领域的三个基准测试中实现了最先进的性能。

2.Exploring Social Media for Early Detection of Depression in COVID-19 Patients

标题：探索社交媒体以早期发现 COVID-19 患者的抑郁症

作者：Jiageng Wu, Xian Wu, Yining Hua, Shixu Lin, Yefeng Zheng, Jie Yang

文章链接：https://arxiv.org/abs/2302.12044v1

项目代码：https://github.com/dragon-wu/depcov-www2023

摘要：

COVID-19 大流行对全球健康造成了重大损害。尽管三年过去了，世界仍在与病毒作斗争。人们越来越担心 COVID-19 对受感染者心理健康的影响，这些人更容易患抑郁症，这可能对受影响的个人和整个世界产生长期影响。早期检测和干预可以降低 COVID-19 患者患抑郁症的风险。在本文中，我们通过社交媒体分析调查了 COVID-19 感染与抑郁症之间的关系。首先，我们管理了一个 COVID-19 患者的数据集，其中包含有关他们感染前后社交媒体活动的信息。其次，我们对该数据集进行了广泛的分析，以调查具有较高抑郁风险的 COVID-19 患者的特征。第三，我们提出了一种用于早期预测抑郁症风险的深度神经网络。该模型将日常情绪波动视为一种精神信号，并通过知识蒸馏结合文本和情感特征。实验结果表明，我们提出的框架在检测抑郁症风险方面优于基线，AUROC 为 0.9317，AUPRC 为 0.8116。我们的模型有可能使公共卫生组织能够对高危患者进行及时干预

Subjects: cs.CV

3.Region-Aware Diffusion for Zero-shot Text-driven Image Editing

标题：用于零样本文本驱动图像编辑的区域感知扩散

作者：Nisha Huang, Fan Tang, WeiMing Dong, Tong-Yee Lee, Changsheng Xu

文章链接：https://arxiv.org/abs/2302.11797v1

项目代码：https://github.com/haha-lisa/RDM-Region-Aware-Diffusion-Model

摘要：

在文本描述的指导下进行图像处理最近受到了广泛的关注。在这项研究中，我们专注于在给定文本提示的指导下对图像进行区域编辑。与当前基于掩码的图像编辑方法不同，我们提出了一种用于实体级图像编辑的新型区域感知扩散模型 (RDM)，它可以自动定位感兴趣的区域并根据给定的文本提示替换它。为了在图像保真度和推理速度之间取得平衡，我们通过结合潜在空间扩散和增强方向引导来设计密集扩散管道。此外，为了保留非编辑区域的图像内容，我们引入了区域感知实体编辑来修改感兴趣区域并保留非感兴趣区域。我们通过广泛的定性和定量实验验证了超出基线方法的拟议 RDM。结果表明，RDM 在视觉质量、整体协调性、非编辑区域内容保留和文本图像语义一致性方面优于以前的方法。这些代码可在 https://github.com/haha-lisa/RDM-Region-Aware-Diffusion-Model 获得。

更多Ai资讯：公主号AiCharm
在这里插入图片描述