当前位置: 首页 > news >正文

单智能体carla强化学习实战工程介绍

有三个工程:
在这里插入图片描述
Ray_Carla: 因为有的论文用多进程训练强化学习,包括ray分布式框架等,这里直接放了一个ray框架的示例代码,是用sac搭建的,obs没用图像,是数值状态向量值(速度那些)。
在这里插入图片描述

Ray_Carla只有v1.0一个更新版本,当然,后续更新可能会增加v2.0,v3.0…,依此类推。

Carla_DRL: 单进程的RL的训练版本之一,目前主要包括三个场景,点到点导航,鬼探头,急刹车,其他场景都可以自行创建。算法包括:PPO,DQN和SAC,这里只有PPO用了视觉图像(用的语义分割图像),训练效果还算可以,但是此种方法需要先训练vae编码器,只用cnn网络处理图像是训不出来的。而vae编码器有个问题,就是出现均值方差为None。
在这里插入图片描述

目前Carla_DRL有三个版本,v3.0是最新的,点进去可以看到代码,下载或者git clone,当然,后续更新可能会增加v4.0,v5.0…,依此类推。

Carla_Deepmdp_RL: 单进程的RL的训练版本之一,目前主要包括2个场景,高速公路和鬼探头,其他场景都可以自行创建。这个deepmdp的目的,就是解决Carla_DRL中,sac等算法不加vae直接输入原始图像无法训练出很好的拟合效果的问题,所以加了一个deepmdp+sac算法的工程,这个工程可以用来跑顶会论文的baseline。理论上,后续的ddpg等新的rl算法都可以在deepmdp基础上加。

在这里插入图片描述

Carla_Deepmdp_RL只有v1.0一个更新版本,当然,后续更新可能会增加v2.0,v3.0…,依此类推。

http://www.lryc.cn/news/478651.html

相关文章:

  • 潮玩宇宙方块兽系统开发:可定制UI与多种游戏内嵌助力个性化体验
  • 什么是低代码?3000字低代码超全解读!
  • 雷池社区版7.1新版本自定义NGINX配置分析
  • [SAP ABAP] 面向对象程序设计-类和对象
  • 『大模型笔记』IBM技术团队:什么是智能体型RAG!
  • WPF 中 NavigationWindow 与 Page 的继承关系解析
  • WebRTC基础理论和通话原理
  • NPU 可不可以代替 GPU
  • Vue3版本的uniapp项目运行至鸿蒙系统
  • 部署stable-diffusion3.5 大模型,文生图
  • 数据采集之selenium模拟登录
  • 机器学习中的两种主要思路:数据驱动与模型驱动
  • 【计算机网络】TCP协议面试常考(一)
  • C#/.NET/.NET Core学习路线集合,学习不迷路!
  • 使用哈希表做计数排序js
  • 京津冀自动驾驶技术行业盛会|2025北京自动驾驶技术展会
  • Chrome与火狐哪个浏览器的隐私追踪功能更好
  • 探索 Python 图像处理的瑞士军刀:Pillow 库
  • JavaScript中的if、else if、else 和 switch
  • Python 使用 langchain 过程中的错误总结
  • MySQL基础篇总结
  • 全面解析:网络协议及其应用
  • 一文了解Java序列化
  • 【前端基础】CSS基础
  • Linux之selinux和防火墙
  • 架构零散知识点
  • 【从零开始的LeetCode-算法】3254. 长度为 K 的子数组的能量值 I
  • 跨IDE开发
  • 2020年美国总统大选数据分析与模型预测
  • C++应用场景开发——学生信息管理系统!!!