当前位置: 首页 > news >正文

【AIGC核心技术剖析】扩大富有表现力的人体姿势和形状估计SMPLer-X模型

富有表现力的人体姿势和形状估计 (EHPS) 将身体、手和面部运动捕捉与众多应用结合起来。尽管取得了令人鼓舞的进展,但当前最先进的方法仍然在很大程度上依赖于有限的训练数据集。在这项工作中,我们研究了将 EHPS 扩展到第一个通用基础模型(称为 SMPLer-X),以 ViT-Huge 作为骨干,并使用来自不同数据源的多达 450 万个实例进行训练。凭借大数据和大模型,SMPLer-X 在不同的测试基准中表现出强大的性能,并且即使在未见过的环境中也具有出色的可移植性。1)对于数据扩展,我们对 32 个 EHPS 数据集进行了系统研究,涵盖了在任何单个数据集上训练的模型无法处理的各种场景。更重要的是,利用从广泛的基准测试过程中获得的见解,我们优化了培训方案并选择了能够使 EHPS 能力实现重大飞跃的数据集。2)对于模型缩放,我们利用视觉变换器来研究EHPS中模型尺寸的缩放规律。此外,我们的微调策略将 SMPLer-X 转变为专业模型,使它们能够实现进一步的性能提升。值得注意的是,我们的基础模型 SMPLer-X 在 AGORA (107.2 mm NMVE)、UBody (57.4 mm PVE)、EgoBody (63.6 mm PVE) 和 EHF (62.3 mm PVE) 等七个基准测试中始终提供最先进的结果无需微调)。
在这里插入图片描述

项目完整介绍:https://caizhongang.github.io/projects/SMPLer-X/

http://www.lryc.cn/news/198794.html

相关文章:

  • 【C++面向对象】1. 类、对象
  • PAM从入门到精通(十三)
  • Stable Diffusion WebUI几种解决手崩溃的方法
  • kr 第三阶段(一)16 位汇编
  • power point导出pdf保留字体
  • 云务器迁移(腾讯云>华为云)
  • [USACO11MAR] Brownie Slicing G题解(二分+二维前缀和+矩阵分割)
  • 【每日一题】—— B. Arrays Sum (Grakn Forces 2020)
  • XTU-OJ 1328-数码和
  • 混入组件 (mixin)
  • ubuntu18.04 RTX3060 rangnet++训练
  • HZOJ-72:猜拳
  • 【Django 03】QuerySet 和 Instance应用
  • 安装 mysql
  • 文件管理系统的基本认识
  • Excel·VBA制作工资条
  • 【SA8295P 源码分析 (二)】10 - HQX Display(OpenWFD)qcdisplaycfg_ADP_STAR_LA.xml 配置文件解析
  • git操作说明
  • 数据结构——栈与队列
  • Redis入门到实战(四、原理篇)RESP协议
  • c++屏蔽qq或者wechat的好友对局域网环境下的指定关键字
  • rviz中显示的点云与网格垂直,将保存的pcd文件转为点云在rviz中显示,并使用octomap_server将点云地图转化为八叉树地图和占据栅格地图
  • 个人博客系统的总结
  • 小程序之实例会议OA的首页 (3)
  • Gson 问题汇总
  • css-水滴登录页
  • Spark Streaming 整合 Flume
  • 如何写出优雅的业务代码
  • 办鹿uniapp小程序(一)
  • #力扣:1684. 统计一致字符串的数目@FDDLC