96SEO 2026-02-19 19:20 8
、轨迹处理和状态估计2.3、匹配的级联2.4、深度外观描述符3、实验4、结论论文链接https://arxiv.org/pdf/1703.07402.pdf摘要

简单在线实时跟踪(SORT)是一种实用的多目标跟踪方法专注于简单、有效的算法。
在本文中我们集成外观信息来提高SORT算法的性能。
由于这一扩展我们能够通过较长时间的遮挡跟踪对象有效地减少了身份开关的数量。
在原始框架的精神下我们将大量的计算复杂性放在离线预训练阶段在这个阶段我们学习了大规模人员再识别数据集上的深度关联度量。
在在线应用过程中我们使用可视化外观空间中的最近邻居查询建立测量到跟踪的关联。
实验评估表明我们的扩展将身份开关的数量减少了45%在高帧速率下实现了整体竞争性能。
随着目标检测技术的发展基于检测的跟踪已成为多目标跟踪领域的主流。
在这个范例中对象轨迹通常是在一个全局优化问题中发现的该问题一次处理整个视频批次。
例如流网络公式[1,2,3]和概率图形模型[4,5,6,7]已经成为这种类型的流行框架。
但是由于批处理的原因这些方法不适用于在线场景因为每个时间步骤都必须有一个目标标识。
更传统的方法是多假设跟踪(MHT)[8]和联合概率数据关联过滤器(JPDAF)[9]。
这些方法在逐帧的基础上执行数据关联。
在JPDAF中单个状态假设是通过对单个测量值的关联可能性进行加权而生成的。
在MHT中所有可能的假设都被跟踪但为了计算的可处理性必须应用修剪方案。
这两种方法最近在检测跟踪场景中被重新使用[10,11]并显示出有前途的结果。
然而这些方法的性能增加了计算和实现的复杂性。
简单在线和实时跟踪(SORT)[12]是一个更简单的框架它在图像空间中执行卡尔曼滤波使用匈牙利方法进行逐帧数据关联并使用关联度量来测量边界框重叠。
这种简单的方法在高帧速率下获得了良好的性能。
在MOT挑战数据集[13]上具有最先进的人员检测器[14]的SORT在标准检测上的平均排名高于MHT。
这不仅强调了目标检测器性能对整体跟踪结果的影响而且从从业者的角度来看也是一个重要的见解。
虽然在跟踪精度和准确性方面实现了良好的总体性能但SORT返回了相对较高的身份切换数量。
这是因为所采用的关联度量只在状态估计不确定性较低时才准确。
因此SORT在通过遮挡进行跟踪方面存在缺陷因为遮挡通常出现在正面视角的相机场景中。
我们通过将关联度量替换为结合了运动和外观信息的更有信息的度量来克服这个问题。
特别是我们应用了卷积神经网络(CNN)该网络经过训练可以在大规模的人再识别数据集上识别行人。
通过集成该网络我们提高了对遗漏和遮挡的鲁棒性同时保持系统易于实现高效并适用于在线场景。
我们的代码和预训练的CNN模型是公开的以促进研究实验和实际应用开发。
我们采用传统的单假设跟踪方法递归卡尔曼滤波和逐帧数据关联。
在下一节中我们将更详细地描述该系统的核心组件。
轨迹处理和卡尔曼滤波框架与[12]中的原始公式基本相同。
我们假设一个非常一般的跟踪场景摄像机是未校准的我们没有可用的自我运动信息。
虽然这些情况对过滤框架构成了挑战但它是最近多对象跟踪基准测试[15]中考虑的最常见的设置。
因此我们的跟踪场景是在八维状态空间(u,v,γ,h,x˙,y˙,γ˙,h˙)(u,
\dot{h})(u,v,γ,h,x˙,y˙,γ˙,h˙)包含边界框中心位置(u,v)(u,
v)(u,v)长宽比γ\gammaγ高度h以及它们在图像坐标中的速度。
我们使用一个标准的卡尔曼滤波器与恒速度运动和线性观测模型其中我们取边界坐标(u,v,γ,h)(u,
对于每个轨道k我们计算自上次成功测量关联ak以来的帧数。
该计数器在卡尔曼滤波预测期间递增并在跟踪与测量相关联时重置为0。
超过预定最大Amax时间的轨迹被认为已经离开场景并从轨迹集中删除。
对于每一个不能与现有轨迹相关联的检测都会启动新的轨迹假设。
这些新的跟踪被归类为初步在前三帧。
在此期间我们希望在每个时间步都有一个成功的度量关联。
在前三帧内未成功关联到测量的轨道将被删除。
为了整合运动信息我们使用预测卡尔曼状态和新到达的测量值之间的(平方)马氏距离:
d(1)(i,j)(dj−yi)TSi−1(dj−yi)(1)d^{(1)}(i,
j)\left(\boldsymbol{d}_{j}-\boldsymbol{y}_{i}\right)^{\mathrm{T}}
\boldsymbol{S}_{i}^{-1}\left(\boldsymbol{d}_{j}-\boldsymbol{y}_{i}\right)
d(1)(i,j)(dj−yi)TSi−1(dj−yi)(1)
其中我们用(yi,Si)(\boldsymbol{y}_{i},\boldsymbol{S}_{i})(yi,Si)表示第i个轨道分布到测量空间的投影用dj\boldsymbol{d}_{j}dj表示第j个检测框。
马氏距离通过测量检测距离平均轨迹位置有多少个标准差来考虑状态估计的不确定性。
此外使用这一指标可以通过在反向χ2分布计算的95%置信区间对马氏距离进行阈值从而排除不太可能的关联。
我们用一个指标来表示这个决定
bi,j(1)1[d(1)(i,j)≤t(1)](2)b_{i,
j}^{(1)}\mathbb{1}\left[d^{(1)}(i,
如果第i个轨道和第j个检测之间的关联是可接受的则计算为1。
对于我们的四维测量空间相应的马氏阈值是t(1)t^{(1)}t(1)
当运动不确定性较低时马氏距离是一个合适的关联度量在我们的图像空间问题公式中从卡尔曼滤波框架中获得的预测状态分布仅提供了物体位置的粗略估计。
特别是未解释的摄像机运动可以在图像平面中引入快速位移使得马氏距离成为通过遮挡跟踪的一个相当不知情的度量。
因此我们将第二个度量集成到分配问题中。
对于每个边界框检测dj\boldsymbol{d}_{j}dj我们用∥rj∥1\left\|\boldsymbol{r}_{j}\right\|1∥rj∥1计算一个外观描述符rj\boldsymbol{r}_{j}rj。
此外我们为每个轨道k保留最后Lk100L_{k}100Lk100个相关外观描述符的图库Rk{rk(i)}k1Lk\mathcal{R}_{k}
\left\{\boldsymbol{r}_{k}^{(i)}\right\}_{k1}^{L_{k}}Rk{rk(i)}k1Lk。
然后我们的第二个指标测量外观空间中第i个轨道和第j个检测之间的最小余弦距离:
d(2)(i,j)min{1−rjTrk(i)∣rk(i)∈Ri}.(3)d^{(2)}(i,
\left\{1-\boldsymbol{r}_{j}^{\mathrm{T}}
d(2)(i,j)min{1−rjTrk(i)∣rk(i)∈Ri}.(3)
bi,j(2)1[d(2)(i,j)≤t(2)](4)b_{i,
j}^{(2)}\mathbb{1}\left[d^{(2)}(i,
我们在一个单独的训练数据集中为这个指标找到一个合适的阈值。
在实践中我们应用预先训练好的CNN来计算边界框外观描述符。
该网络的结构将在2.4节中描述。
结合起来这两个度量标准通过服务于分配问题的不同方面而相互补充。
一方面马氏距离提供了基于运动的可能物体位置的信息这对短期预测特别有用。
另一方面余弦距离考虑的外观信息是特别有用的恢复身份后长期咬合当运动的区别不大。
为了构建关联问题我们使用加权和将两个指标结合起来
ci,jλd(1)(i,j)(1−λ)d(2)(i,j)(5)c_{i,
ci,jλd(1)(i,j)(1−λ)d(2)(i,j)(5)
通过超参数λ可以控制各指标对组合关联成本的影响。
在我们的实验中我们发现当有大量的相机运动时设置λ
0是一个合理的选择。
在此设置中关联成本项中只使用外观信息。
然而马氏门仍然被用来忽略基于卡尔曼滤波器推断的可能目标位置的不可行分配。
本文引入了一个级联来解决一系列子问题而不是在全局分配问题中解决测量到跟踪的关联。
为了激励这种方法考虑以下情况:当一个物体被遮挡的时间较长时随后的卡尔曼滤波预测增加了与物体位置相关的不确定性。
因此概率质量在状态空间中扩散观测似然峰值变小。
直观地说关联度量应该通过增加测量到轨道的距离来解释这种概率质量的扩散。
与直觉相反当两个航迹竞争同一检测时马氏距离倾向于更大的不确定性因为它有效地减少了任何检测的标准差距离到预测航迹平均值。
这是一种不受欢迎的行为因为它会导致增加轨道碎片和不稳定的轨道。
因此我们引入了一个匹配级联优先考虑更常见的对象以编码我们的关联似然中的概率分布概念。
1概述了我们的匹配算法。
作为输入我们提供了轨迹T\mathcal{T}T和检测D\mathcal{D}D指数集以及最大年龄AmaxA_{max}Amax。
在第1行和第2行中我们计算关联成本矩阵和可接受关联矩阵。
然后我们迭代轨道年龄n以解决一个线性分配问题的轨迹年龄增加。
在第6行中我们选择在最后n帧中没有与检测相关联的轨道Tn\mathcal{T}_{n}Tn的子集。
在第7行中我们解决了Tn\mathcal{T}_{n}Tn轨道和不匹配检测U\mathcal{U}U之间的线性分配。
在第8行和第9行中我们更新匹配集和未匹配检测并在第11行完成后返回。
请注意这种匹配级联优先考虑年龄较小的轨迹即。
最近才看到的痕迹。
1的未经确认和未匹配的轨迹集上运行原始SORT算法[12]中提出的联合关联交叉。
这有助于解释突然的外观变化例如由于静态场景几何的部分遮挡并增加对错误初始化的鲁棒性。
通过使用简单的最近邻查询而不需要额外的度量学习我们的方法的成功应用需要在实际的在线跟踪应用之前离线训练具有良好辨别能力的特征嵌入。
为此我们使用了一个经过大规模人员再识别数据集[21]训练的CNN该数据集包含1261名行人的110多万张图像使其非常适合在人员跟踪环境中进行深度度量学习。
我们网络的CNN架构如表1所示。
总之我们使用了一个宽残差网络[22]它有两个卷积层后面跟着六个残差块。
在致密层10中计算维度为128的全局特征图。
最后一批和ℓ2\ell_{2}ℓ2归一化将特征投射到单位超球上以与我们的余弦外观度量兼容。
总的来说网络有2,800,864个参数在Nvidia
1050移动GPU上一个32个边界框的向前传递大约需要30毫秒。
因此这个网络非常适合在线跟踪前提是有一个现代的GPU可用。
虽然我们的训练过程的细节超出了本文的范围但我们在GitHub存储库中提供了一个预训练的模型以及一个可用于生成特征的脚本。
我们在MOT16基准[15]上评估我们的跟踪器的性能。
该基准评估了七个具有挑战性的测试序列的跟踪性能包括移动摄像头的正面场景以及自上而下的监视设置。
作为我们跟踪器的输入我们依赖于Yu
al.[16]提供的检测。
他们在公共和私人数据集上训练了一个Faster-RCNN以提供出色的性能。
为了进行公平的比较我们在相同的检测上重新运行了SORT。
30帧对试验序列进行评价。
与[16]一样检测阈值为0:3的置信分数。
我们的方法的其余参数已经找到了由基准提供的单独的训练序列。
评估依据以下指标进行:
多目标跟踪精度(MOTA):根据假阳性、假阴性和身份开关[23]总结总体跟踪精度。
多目标跟踪精度(MOTP):根据地面真相和报告位置[23]之间的包围盒重叠来总结总体跟踪精度。
大部分跟踪(MT):在至少80%的生命周期内具有相同标签的真实跟踪的百分比。
大部分丢失(ML):在其生命周期中最多追踪20%的基本真相轨迹的百分比。
身份切换(ID):地面真相轨道报告的身份更改的次数。
碎片(FM):由于缺失检测而中断轨道的次数。
评估结果如表2所示。
我们的适应成功地减少了身份切换的数量。
与SORT相比ID切换从1423减少到781。
这大约减少了45%。
同时由于通过遮挡和遗漏保持目标身份轨迹碎片略有增加。
我们还看到大部分被跟踪的物体数量显著增加大部分丢失的物体数量减少。
总的来说由于外观信息的整合我们成功地在较长时间的遮挡下保持身份。
这一点也可以从我们在补充材料中提供的跟踪输出的定性分析中看出。
图1显示了跟踪器的示例输出。
我们的方法也是其他在线跟踪框架的有力竞争者。
特别是我们的方法在所有在线方法中返回最少数量的身份切换同时保持有竞争力的MOTA分数、轨道碎片和假阴性。
报告的跟踪精度主要受到大量误报的影响。
考虑到它们对MOTA评分的整体影响对检测应用更大的置信阈值可能会极大地提高我们算法的报告性能。
然而对跟踪输出的视觉检查表明这些假阳性主要是由静态场景几何上的零星检测器响应产生的。
由于我们相对较大的最大允许轨道年龄这些更常见地连接到物体轨迹。
同时我们没有观察到在假警报之间频繁跳跃的轨道。
相反跟踪器通常在报告的对象位置生成相对稳定的静止轨道。
Hz的频率运行大约一半的时间花在特征生成上。
因此给定现代GPU系统保持计算效率并实时运行。
我们已经提出了SORT的一个扩展它通过预先训练的关联度量来合并外观信息。
由于这一扩展我们能够跟踪更长的遮挡时间使SORT成为最先进的在线跟踪算法的强大竞争对手。
然而该算法仍然易于实现并且是实时运行的。
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback