当前位置: 首页 > news >正文

每日学术速递2.23

Subjects: Robotics

1.On discrete symmetries of robotics systems: A group-theoretic and data-driven analysis

标题:关于机器人系统的离散对称性:群论和数据驱动分析

作者:Daniel Ordonez-Apraez, Mario Martin, Antonio Agudo, Francesc Moreno-Noguer

文章链接:https://arxiv.org/abs/2302.10433v1

项目代码:https://github.com/danfoa/robotequivariantnn

摘要:

        本文探讨了动态系统中的离散形态对称性,这是生物学和机器人系统的主要特征。当系统的形态具有一个或多个对称平面时,它表现出形态对称性,描述了身体部位的重复和平衡分布。这些形态对称性意味着系统的动力学是对称的(或近似对称的),这进而在最优控制策略和所有与系统动态演化相关的本体感知和外感知测量中印记了对称性。对于数据驱动的方法,对称性表示归纳偏差,有助于数据增强和构建对称函数逼近器。本文利用群论提出了一个理论和实践框架,允许(1)识别系统的形态对称群G,(2)本体感知和外感知测量的数据增强,以及(3)通过使用G等变/不变神经网络利用数据对称性,针对合成和真实世界应用提出了实验结果,展示了对称性约束如何提高样本效率和泛化能力,同时减少可训练参数的数量。

Subjects: cs.CV

2.BrackishMOT: The Brackish Multi-Object Tracking Dataset

标题:BrackishMOT:咸水多目标跟踪数据集

作者:Malte Pedersen, Daniel Lehotský, Ivan Nikolov, Thomas B. Moeslund

文章链接:https://arxiv.org/abs/2302.10645v1

项目代码:https://github.com/daniellehot/Underwater-Fish-Environment

摘要:

        不存在在浑浊环境中捕获的公开可用的带注释的水下多目标跟踪 (MOT) 数据集。为了解决这个问题,我们提出了 BrackishMOT 数据集,重点是跟踪小鱼群,这是众所周知的困难 MOT 任务。BrackishMOT 由 98 个在野外捕获的序列组成。除了新颖的数据集,我们还通过训练最先进的跟踪器来呈现基线结果。此外,我们提出了一个用于创建合成序列的框架以扩展数据集。该框架由动画鱼模型和逼真的水下环境组成。我们分析了在训练过程中包含合成数据的效果,并表明真实和合成水下训练数据的结合可以提高跟踪性能。

Subjects: cs.RL

3.Minimax-Bayes Reinforcement Learning

标题:Minimax-Bayes 强化学习

作者:Thomas Kleine Buening, Christos Dimitrakakis, Hannes Eriksson, Divya Grover, Emilio Jorge

文章链接:https://arxiv.org/abs/2302.10831v1

项目代码:https://github.com/minimaxbrl/minimax-bayes-rl

摘要:

        虽然贝叶斯决策理论框架为不确定性下的决策问题提供了一种优雅的解决方案,但一个问题是如何适当地选择先验分布。一个想法是采用最坏情况先验。然而,这在顺序决策制定中不像在简单的统计估计问题中那样容易指定。本文针对各种强化学习问题研究(有时是近似的)minimax-Bayes 解决方案,以深入了解相应先验和策略的属性。我们发现,虽然最坏情况先验取决于设置,但相应的极小极大策略比假设标准(即统一)先验的策略更稳健。

http://www.lryc.cn/news/18407.html

相关文章:

  • LeetCode 232. 用栈实现队列
  • AI算法创新赛-人车目标检测竞赛总结04
  • 【C语言进阶】动态内存管理详解与常见动态内存错误以及柔性数组使用与介绍
  • 【C++】string的模拟实现
  • 前端借助Canvas实现压缩base64图片两种方法
  • 用ChatGPT生成Excel公式,太方便了
  • 【Kubernetes 企业项目实战】09、Rancher 2.6 管理 k8s-v1.23 及以上版本高可用集群
  • 在Excel中按条件筛选数据并存入新的表
  • 【面试题】MySQL索引相关知识点
  • MySQL索引类型及原理?一文读懂
  • 【C语言】字符分类函数+内存函数
  • 高通平台开发系列讲解(SIM卡篇)SIM卡基础概念
  • 记录一次ubuntu下配置ssh登录出现的问题
  • 深度剖析数据在内存中的存储(下)(适合初学者)
  • 智慧物联网系统源码:一个用于数据的收集、处理、可视化、设备管理、设备预警、报警的平台
  • 2023年,拥有软考证书在这些地区可以领取福利补贴
  • 使用Unity在材质球上实现绘画:详细解释每一行Shader代码!
  • Tesseract 4.0训练字库并且识别训练后的图片
  • ChatGPT热潮背后,金融行业大模型应用路在何方?——金融行业大模型应用探索
  • 【怎么预防sql注入,以及还有预防其他的什么网络攻击】
  • 2023年全国最新机动车签字授权人精选真题及答案4
  • 【Java】用记事本实现“HelloWorld”输出
  • 我希望早点知道的关于成长的建议
  • 【哈希表】使用方法总结
  • 【笑小枫-面试篇】Java基础面试题整理,努力做全网最全
  • 亚马逊短期疲软,但长期前景乐观
  • webgis高德地图
  • django项目实战十(django+bootstrap实现增删改查)进阶数据统计
  • 【布隆过滤器(Bloom Filter)基本概念与原理、Bloom Filter优点与缺点、以及应用场景】
  • unity的Rendertexture上面显示粒子特效最便捷的解决方案