当前位置: 首页 > news >正文

3D检测笔记:基础坐标系与标注框介绍

目录

  • 二维坐标系
    • 图像坐标系
    • 像素坐标系
  • 三维坐标系
    • 左手系与右手系
      • 判定
      • 特点
    • 相机坐标系
    • 车身/激光雷达坐标系
    • 深度坐标系
    • 东北天(ENU)坐标系
  • 标注框

二维坐标系

图像坐标系

  • 原点: 左上角为原点。
  • 坐标轴:从上到下为y轴,从左到右为x轴。

在这里插入图片描述

像素坐标系

  • 原点:图像左上角(与屏幕坐标系一致)‌。
  • 坐标轴:横轴(u)为列数,纵轴(v)为行数,单位为像素‌。
  • 特点:OpenCV的像素坐标系与传统数学坐标系Y轴方向相反(向下为正)‌。

在这里插入图片描述

三维坐标系

左手系与右手系

判定

 左手系和右手系并不是两个固定的坐标系,而是x,y,z轴的两个组合顺序
判定左手系和右手系的方法也很简单:====

  • 右手大拇指指向Z轴方向,其余四指由X轴指向Y轴;符合这个条件的为右手系。
    在这里插入图片描述
  • 左手大拇指指向Z轴方向,其余四指由X轴指向Y轴;符合这个条件的为左手系。
    在这里插入图片描述

特点

  • 从垂直旋转轴的上方看,右手系逆时针旋转为正,顺时针为负。
    左手系顺时针为正方向,逆时针为负方向。
  • 同为左手系或者右手系的坐标变换是刚体变换,可以用旋转矩阵+平移矩阵表示。

相机坐标系

 相机坐标系是右手系,以镜头主光轴中心为原点,定义为右(x)、下(y)、前(z)
在这里插入图片描述
可以简记为在图像坐标系的基础上加入向前的深度(Z)轴

车身/激光雷达坐标系

 现在最常用的激光雷达/车身的坐标系也是采用右手系,具体定义为:前(X)、左(Y)、上(Z)
在这里插入图片描述

深度坐标系

 深度坐标系(Depth),此坐标系主要被用于通过深度相机采集的数据集, 大多是室内场景点云检测。
 在MMDetection3D中定义如下:
在这里插入图片描述

东北天(ENU)坐标系

 东北天坐标系(ENU)一般用于导航和地理信息系统的局部参考坐标系。
‌ E是East的缩写,表示X轴指向的方向为正东;N是North的缩写,表示Y轴指向的方向为正北;U是Up的缩写,表示Z指向的方向为垂直于水平面向上(天顶),XYZ构成右手坐标系。

标注框

这里采用MMDetection3D的标准来介绍3D标注框:

 在 3D 目标检测中,框 Box 通常表示为:(x, y, z, x_size, y_size, z_size, yaw)。
 其中 (x, y, z) 表示框的位置 ,(x_size, y_size, z_size) 表示框的尺寸,yaw 表示框的朝向角。

MMDetection3D中,以x轴方向为参考方向,定义各个参数的意义为:

  1. 3D 框的尺寸 (x_size, y_size, z_size),按惯例定义为物体 3D 框在朝向角 yaw 角度为 0 时沿着 x, y, z 轴三个方向的长度。
  2. 朝向角Yaw,定义为与参考方向的夹角(0-180°)。在深度坐标系、激光雷达坐标系当中大小的定义与右手系标准相同,即朝向角增大的方向为逆时针,也就是说从x轴到朝向边,逆时针为正,顺时针为负

深度坐标系标准:
在这里插入图片描述
雷达坐标系标准:
在这里插入图片描述
相机坐标系标准(朝向角大小与右手系相反):
在这里插入图片描述

http://www.lryc.cn/news/624990.html

相关文章:

  • JAiRouter 架构揭秘:一个面向 AI 时代的响应式网关设计
  • JUC读写锁
  • 宁波市第八届网络安全大赛初赛(REVERSE-Writeup)
  • 基于Spring Boot+Vue的社区便民服务平台 智慧社区平台 志愿者服务管理
  • day25|学习前端js
  • Product Hunt 每日热榜 | 2025-08-18
  • 【yocto】为什么要选择yocto?
  • 亚马逊新手突围:从流量破冰到持续出单
  • Less (CSS 预处理器)
  • 问答社区运营优化:cpolar 提升 Answer 平台远程访问速度方案
  • 性能测试(Jemter)
  • day44_2025-08-18
  • PMP-项目管理-十大知识领域:风险管理-识别、评估、应对项目风险
  • 兴趣爱好——虾哥开源小智AI机器人搭建(丐版—最低成本)ESP32开发板 MicroPython V1.0.0 Rev1
  • 继承中的向上转型、向下转型与动态绑定的深入解析
  • 学习游戏制作记录(各种独特物品效果)8.18
  • 【Langchain系列二】LangChain+Prompt +LLM智能问答入门
  • Prompt engineering(PE) —— prompt 优化如何进行?
  • 集成电路学习:什么是Face Detection人脸检测
  • leetcode4_452 and 763
  • 【论文学习】UoMo: 一个用于无线网络优化的移动流量预测通用模型
  • 学习嵌入式的第二十天——数据结构
  • 如何解决机器翻译的“幻觉“问题(Hallucination)?
  • 特赞内容运营解决方案,AI重构品牌内容价值链
  • (Arxiv-2025)OPENS2V-NEXUS:一个面向主体到视频生成的详细基准与百万规模数据集
  • 知识蒸馏 - 各类概率分布
  • 概率论基础教程第4章 随机变量(三)
  • 基于 Ansible 与 Jinja2 模板的 LNMP 环境及 WordPress 自动化部署实践
  • 数据库:表和索引结构
  • 【68页PPT】智慧方案信息物理系统与数字孪生某著名企业(附下载方式)