2D 多目标跟踪性能指标
MOTA (Multiple Object Tracking Accuracy)
MOTA 是多目标跟踪中最常用的综合性能指标,衡量跟踪目标的准确性,考虑了三种主要错误类型:漏检(False Negatives, FN)、误检(False Positives, FP)和身份切换(ID Switches, IDS)。MOTA 的计算公式如下:
MOTA=1−∑tGTt∑t(FNt+FPt+IDSt)
其中,FNt 是时间步 t 的漏检数量,FPt 是误检数量,IDSt 是身份切换数量,GTt 是时间步 t 的真实目标数量。MOTA 的值越高,表示跟踪算法的性能越好。
MOTP (Multiple Object Tracking Precision)
MOTP 衡量跟踪目标的精度,计算公式如下:
MOTP=∑tct∑i,tdi,t
其中,di,t 是时间步 t 中目标 i 的位置误差,ct 是时间步 t 中正确匹配的目标数量。这里的位置误差通常使用目标边界框的重叠度(如 IoU)来衡量,以此 MOTP 的值越高,表示跟踪精度越高。
IDF1 (Identification F1 Score)
IDF1 衡量跟踪算法在保持目标身份一致性方面的性能,计算公式如下:
IDF1=2⋅IDTP+IDFP+IDFN2⋅IDTP=IDP1+IDR12IDP=IDTP+IDFPIDTP,IDR=IDTP+IDFNIDTP
其中,IDTP 是正确识别的目标数量,IDFP 是错误识别的目标数量,IDFN 是未识别的目标数量。IDF1 的值越高,表示跟踪算法在保持一致的对象识别更有效。
IDP(Identification Precision)和 IDR(Identification Recall)分别衡量识别的精确度和召回率。
HOTA (Higher Order Tracking Accuracy)
HOTA 是一种综合考虑检测和跟踪质量的评估指标,旨在解决 MOTA 在 ID 频繁切换场景下的不足。HOTA 的计算公式如下:
HOTA=∣N∣1i∈N∑DetA(αi)⋅AssA(αi)DetA(α)=TPα+FNα+FPαTPα,AssA(α)=TPαIDTPα
MT (Mostly Tracked)
MT 衡量在整个视频序列中被成功跟踪的目标比例。一个目标如果在其生命周期内被正确跟踪超过 80% 的时间,则被认为是“Mostly Tracked”。
ML (Mostly Lost)
ML 衡量在整个视频序列中几乎未被跟踪的目标比例。一个目标如果在其生命周期内被正确跟踪少于 20% 的时间,则被认为是“Mostly Lost”。
FAF (False Alarms per Frame)
FAF 衡量每帧图像中误检(False Positives)的平均数量。FAF 的值越低,表示跟踪算法的误检率越低。
Frag (Fragmented)
Frag 衡量轨迹的断裂次数。较低的 Frag 值表示跟踪算法能够更好地保持目标的连续性。
3D 多目标跟踪性能指标
3D 多目标跟踪任务中,有一些性能指标与 2D 多目标跟踪类似,但也有一些特定于 3D 跟踪的指标。
AMOTA (Average MOTA)
AMOTA 是 3D 多目标跟踪中常用的综合性能指标,是 MOTA 在不同召回率下的平均值,对于不同的召回率 r,计算对应的 MOTAR,然后取平均值。计算公式如下:
AMOTA=n−11r∈{n−11,n−12,…,1}∑MOTARMOTAR=max(0, 1−r∗PIDSr+FPr+FNr−(1−r)∗P)
AMOTP (Average MOTP)
AMOTP 衡量 3D 多目标跟踪的精度,是 MOTP 在不同召回率下的平均值。计算公式如下:
AMOTP=n−11r∈{n−11,n−12,…,1}∑∑tct∑i,tdi,t
其中,di,t 是时间步 t 中目标 i 的 3D 位置误差,ct 是时间步 t 中正确匹配的目标数量。
TID (average track initialization duration in seconds)
TID 衡量从目标出现到被成功跟踪的平均时间,单位为秒。较低的 TID 值表示跟踪算法能够更快地初始化目标跟踪。
LGD (average longest gap duration in seconds)
LGD 衡量目标在跟踪过程中最长的断裂时间,单位为秒。较低的 LGD 值表示跟踪算法能够更好地保持目标的连续性。
参考资料