当前位置: 首页 > news >正文

多模态智能

研究背景:


深度学习从1.0的端到端走向2.0的预训练,通过大规模预训练来记忆多模态数据中共性知识,增强对下游任务的学习能力。

深度学习1.0:特定任务有标注训练数据->随机初始化训练->最终模型

深度学习2.0:大规模无标注数据自监督预训练(BERT、CLIP)(特定任务有标注训练数据)->模型微调->最终模型

预训练的本质是让模型参数不再随机初始化,仍停留在感知层面。

多模态推动从感知到认知和推理。

面临的挑战:

多模态数据输入表示的准确性、表示到推理的合理性、模型鲁棒性:数据表示难以控制、推理过程难以理解、决策结果不够鲁棒。

1.表示的准确性:

方法

联合表示:投影到一个共同空间中进行学习。

协调表示:分别学习不同模态特征,期间施加特定的约束来使不同模态的特征互相融合。

难点
  • 克服多模态数据的异质性挑战

大规模预训练需要大量数据,当数据量少或缺失时,如何设计并优化多模态模型提升异质特征的准确性:从深度学习内在机制出发,通过设计不同耦合度的网络组合损失来学习并优化不同网络层的异质特征。(各异的低层结构表征(深度学习尾部提取)和一致的高层语义关系(深度学习头部提取))

  • 挖掘异质数据互补性和关联性

自注意力或跨注意力机制都无法充分捕捉多模态任务中互补的上下文关系,如何进一步实现异模数据充分交互:设计联合注意力机制和多粒度学习策略增强,最终可以利用无标注数据实现分割,同时刻画模态内和模态间互补的上下文关系。

越大规模数据越容易出现不易发现的噪声,如何保证数据特征和语义标签之间的关联性:设计基于代理的对比损失(借助代理减小语义鸿沟,提出互量化损失,对齐数据同分布增强语义一致性)和互量化损失,置信样本挑选策略抵御噪声影响

2.推理合理性:

方法

相关性推理:挖掘存在的大量关联关系,执行相关性驱动的推理决策;

因果性推理:挖掘潜藏因果关系,是推理更鲁棒、可解释

难点
  • 如何实现小数据下的知识发现、推理和更新

如何利用海量无标签数据提升模型推理能力,如何利用已有知识高效发现无标签数据中的知识:训练过程包含有标签和无标签数据,且类别信息不重叠,基于分治策略,对两种数据进行建模,设计两组组合专家模型,分别从特征、语义层面,建模新、旧知识的差异性和互补性,挖掘新知识。提出局部知识共享学习策略,通过聚合在线/离线知识的优化目标,促进知识更新的局部一致性,提升发现知识的准确性。

如何准确捕捉细粒度的语义概念组合关系,实现精准推理:设计自适应语义分解组合学习策略刻画细粒度语义关系,提出分层分解组合学习机制,构造属性、目标子空间及其组合空间,学习语义概念的局部模式及组合模式,提升多模态推理泛化能力。

  • 如何克服知识学习过程中的灾难性遗忘问题

。。。。。。。

参考:西安电子科技大学老师邓成的会议报告

http://www.lryc.cn/news/458023.html

相关文章:

  • 【机器学习(十三)】机器学习回归案例之股票价格预测分析—Sentosa_DSML社区版
  • 大模型微调
  • 240607 继承
  • 轻松应对意外丢失:高效电脑数据恢复指南!
  • vue项目中播放rtsp视频流
  • tomcat部署web配置环境变量
  • 数据仓库技术及应用(练习1)
  • 老板的“神助攻”:公司电脑监控软件
  • 前端vue部署网站
  • Unity3D 动画回调函数详解
  • el-table表格表尾合计行,指定合计某几列,自定义合计方法
  • 一款工具替你解决Mac电脑菜单栏图标杂乱问题
  • MySQL 基础入门教程
  • 俏生元将传统膳食智慧融入现代生活,自然成分绽放健康光彩
  • 腾讯云推流播放相关
  • UE5运行时动态加载场景角色动画任意搭配-相机及运镜(二)
  • @JsonAlias和@JSONField序列化和反序列化
  • k8s1.27部署ingress 1.11.2
  • 【运维】自动化运维详解
  • 线控底盘技术介绍
  • DOM对象
  • [SQL] 数据库图形化安装和使用
  • springboot 前后端处理日志
  • C++11 简单手撕多线程编程
  • 刷c语言练习题7(牛客网)
  • Web Worker和WebSocket
  • 【LeetCode】动态规划—712. 两个字符串的最小ASCII删除和(附完整Python/C++代码)
  • wordpress Contact Form 7插件提交留言时发生错误可能的原因
  • uibot发送邮件:自动化邮件发送教程详解!
  • 【PostgreSQL】PG数据库表“膨胀”粗浅学习