96SEO 2026-02-20 00:14 6
。

目前#xff0c;大部分的工作是倾向于用点云去做三维检测#xff0c;点云实际上是通过传感器去扫描出来的一…分享嘉宾
3D检测是在三维世界中去定位和分类不同的物体与传统2D检测的区别在于它有一个深度信息。
目前大部分的工作是倾向于用点云去做三维检测点云实际上是通过传感器去扫描出来的一系列点这些点是分布在物体的表面所以通过点云可以清楚的观察到一个物体的形状所以最终做三位检测的准确率也会更高。
点云实际上有三个特点首先是无序性其次是稀疏性第三是无法准确的描述一个物体。
所以现在的基于点云的3D检测框架可以分成两大类一类是先把点云变成图片似的密集表示然后再去像图片一样去处理点云另一类是先处理成有序的、密集的表示叫做基于体素的检测器。
它的思路是把点云转换成均匀分布的体素然后采用CNN的方式去处理使用的特征提取的网络用的是类似于稀疏卷积网络。
介绍一下基于体素检测一个相关的工作它叫做pointpillars速度很快如图1所示。
在得到稀疏点云之后去做体素化跟一般的体素化的区别在于它是把三维点云分成无数个pillars即无限高的体素但是忽略高度这一维在这之后可以用2DCNN去提取特征然后再用图片上常用的2D检测器的头部去做最后的预测。
对于在点云中为什么需要上采样层是因为原先点云在特征提取网络之后只剩下少量的点那少量的点不一定会出现在物体的框里。
如果最后选到的少量点不出现在物体的框里那对于检测器来讲是一个很不好的情况因为很难去回归出此框。
假如检测器没有上采样层实际上只可以回归出来两个红色框对于其他的黄色框来讲由于它们内部不存在选到的点所以这些框就相当于直接被检测器给Miss掉如图2所示。
图1右边是统计了一些数据发现看在取4096个点时有99.7%的物体是属于红色框即存在内部点被选中。
取1024个点时只有65.9%的内部点被选中。
到512个点时就只有51.8%了。
所以实际上如果是用这种方式来去设计检测器光从选点角度来看就已经有48.2%的框完全没有机会检测到。
但目标是建立一个非常简单的检测器所以希望删掉上采样层。
那么考虑一种方式在选点只有512或更少的情况下也能召回这些框这里是提出Feature
Sampling(F-FPS)。
实际上它是基于特征的选点策略还是图1所示的场景绝大多数的背景点实际上都是地面特征具有一定的类似。
前景点是属于车或人或一些其他的前景物体特征与背景是有一定的区别。
因为它们之间特征存在区别然后再加上最远点采样就可以直接根据特征去做采样这样可以尽可能的去采到特征不同的点。
所以它的优势在于可以去删掉大量的背景点另外是可以为前景去拿到它的内部点。
下面来介绍3DSSD框架如图3所示。
它最主要的改进点在于之前提到的F-FPS,然后加上D-FPS去做采样采样完成之后里面的每个模块都用类似于pointnet去对采样到的点做特征提取。
特征提取层最终采的点处于物体边界上的点对回归不太友好这里目标是采样点在物体中心。
所以提出了一个Kennedy
layer这个layer的目的是把一个个在边界的采样点给移动到物体的中心再这之后去进行最后的检测。
最后生成预测框或生成分类分数去产生最后的结果。
3D-MAN是为了解决单帧点云不能正确描述物体形状的特点而设计出来的框架如图4所示。
拿到单帧点云之后经过一个检测器得到检测结果并存到memory
bank里面存的是这一帧和这一帧之前的前N帧所有对应的内部物体和对应的物体特征。
需要这些物体和物体特征是希望拿到同一个物体在不同帧的特征然后进行融合从而去解决单帧的问题融合之后去做检测。
对于生成物体的特征首先是采用pillar检测器所以实际上拿到了一个经过backbone的2D特征图。
在拿到物体后先把物体平均分成2乘3的网格且均匀分布在物体内部。
在拿到great
map上的位置然后通过双线性插值去获得它在featuremap上的位置和特征在拿到六个网格的特征之后去做平均池化得到所对应的proposal将proposal对应的特征去存到memory
当产生完一个个proposal的feature之后就能拿到当前帧proposal的feature和存在memory
bank里面不同帧proposal的feature接着使用cross
attention去计算相似度然后利用相似度去组合当前帧所对应的proposal和特征。
最后使用不同帧的特征进行融合生成最后的预测结果。
attention实际上是基于相似度进行的然后把相似度就暂时简称为attention
map可以发现它的对角线相比于其他位都是有更加大的亮度也就是表示它的相似度很高。
所以实际上这个模块是在做隐式的track也就是可以从其他具有相似角度和大小的物体上找一些信息理论上就可能会得到更好的效果
现在3D检测里面是存在基于体素和基于点的方法这是两个完全分开的研究领域而实际上是希望提出一个统一的框架来进行3D检测所以来介绍下这篇《A
EQ-paradigm的整个流程如图6所示。
首先是输入点云然后经过特征提取网络这个特征提取网络既可以是基于体素的也可以是基于点的最后通过查询去连接不同的head即可以任意切换head去做分类、分割、基于体素的检测或是基于点的检测等等。
Stage这个希望它可以是任何一个存在的、顶尖的、基于体素或基于点的特征提取网络也就是不管head和task这个地方可以随意选择。
而EQ-paradigm里最重要的设计是Query
position实际上是连接特征提取网络和对应的头部的重要组件。
query
position去提取它对应的特征这里简称为representation。
然后不同的头部去根据representation生成所对应的最后检测结果。
position的选取是根据任务和所需要的head比方如图7所示橙色的点是点云里面的一些点如果希望去做语义分割
position是这个点云场景下所有的点因为语义分割是需要对所有的点做一个分类。
如果要做分类那position是物体所对应的中心点。
position生成特征这里所用的方式其实是transform因为transform实际上非常好去做query。
具体如图7所示拿到一些query
point里面去拿到它所对应的特征这些support实际上是前面选择网络所生成得一些特征。
之后会通过Q-decode
point作为K和V然后把这些query作为Q输入到里面去生成它所对应attention的特征然后会多叠几层qblock这里是有6层然后不断迭代式的更新它所对应的query
在EQ-paradigm之后可以把不同的模型及不同的backbone统一到同一个框架里面所以在有了这个框架之后可以像2D一样去真正的做一个类似于2D里面的restnet等所有检测器都可以去用的特征提取网络这个现在其实还没有文章去做这件事情。
第二个是当有了一个统一的特征提取网络之后实际上就可以去真正的做一个对于所有基于点云模型统一的pretraining网络无论是基于体素还是基于点。
最后一个是可以去用基于图片的特征网路去提取特征这些都是未来可以做的一些方面。
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback