Background

BBox类的实现与使用

268
1 分钟阅读

BBox类概述

BBox类是用于表示三维边界框(3D Bounding Box)的数据结构,包含位置、尺寸和方向等属性。它在3D目标检测和多目标跟踪任务中起着关键作用。

在nuScenes数据集中,检测结果的结构如下所示:

sample_result {
"sample_token": <str> # 样本的唯一标识符。
"translation": <float> [3] # 估计的边界框位置,单位为米,格式为[x, y, z]。
"size": <float> [3] # 估计的边界框尺寸,单位为米,格式为[length, width, height]。
"rotation": <float> [4] # 估计的边界框朝向,使用四元数表示,格式为[x, y, z, w]。
"velocity": <float> [2] # 估计的边界框速度,单位为m/s,格式为[vx, vy]。
"acceleration": <float> [2] # 估计的边界框加速度,单位为m/s²,格式为[ax, ay]。
"detection_name": <str> # 预测的目标类别名称,例如car, pedestrian等。
"detection_score": <float> # 预测的目标类别置信度分数,范围为[0.0, 1.0]。
"attribute_name": <str> # 预测的目标属性名称,例如parked, moving等。
}

我们使用 BBox 类来封装上述信息,

BBox类的实现与使用
/blog/26028696
作者
发布于
2026/1/15
许可协议
CC BY-NC-SA 4.0