当前位置：首页 > news >正文

【AI面试】NMS 与 Soft NMS 的辨析

news 2025/8/3 18:59:35

往期文章：

一、NMS

非极大值抑制（Non-Maximum Suppression，NMS），并不是深度学习时期，目标检测的产物。在传统的图像处理领域，就已经引入了NMS算法。所以，他是老算法的新使用。

NMS算法的步骤：

在Canny边缘检测、霍夫变换圆形检测里面，也都会用到NMS对多余的点、圆心进行去除。那此事排序用到的值就不再是置信度了，是梯度的值、圆心点的投票数了。

这两个更多细节的，可以参考这里：

问一个面试官常快问快答的问题：

是阈值低，最后留下的多，还是阈值高，最后留下的多？

答案是：阈值高，留下的多。

因为你的目的是要把次的、不重要的给剔除掉。那么你设定的重复阈值高，自然重复的就少，删除的也就少，最后留下来的自然就变多了。

在这里插入图片描述

Soft NMS 是 NMS 的一种变种，改进版本。从名字我们就大概能猜出来一些：没有NMS那么的硬（hard），比较的软（soft）。

绝大部分目标检测方法，最后都要用到 NMS-非极大值抑制进行后处理。通常的做法是将检测框按得分排序，然后保留得分最高的框，同时删除与该框重叠面积大于一定比例的其它框。那为什么还要改进，推出一个Soft NMS 呢？

NMS 的这种贪心式方法存在如下图所示的问题：

红色框和绿色框是当前的检测结果，二者的得分分别是0.95和0.80。如果按照传统的NMS进行处理，首先选中得分最高的红色框，然后绿色框就会因为与之重叠面积过大而被删掉。

另一方面，NMS的阈值也不太容易确定，设小了会出现绿色框因为和红色框重叠面积较大而被删掉，设置过高又容易增大误检。

nms 我两个都要，那该给个什么思路呢？不要粗鲁地删除所有IOU大于阈值的框，而是降低其置信度。

Soft NMS思路和做法如下：

原来的NMS可以描述为：将IOU大于阈值的窗口的得分全部置为0。公式如下：
nms
用人话解释下NMS的公式，就是：

而SoftNMS可以描述为：将IOU大于阈值的窗口的得分进行改写，iou越大，（1-iou）就越小。线性加权的公式如下：
softnms
对比NMS，用人话解释下softNMS的公式，就是：

对比总结：

论文展示结果又回到前面两匹马的问题上来。假设框1的置信度是0.95，框2的置信度是0.8，还有一个框3的置信度是0.7。我们最终的目的是将框1和框2保留下来，将框3进行剔除掉。

假设使用的是NMS，那么框2和3都会被剔除掉，因为他们与框1的iou都比较高，很大可能性是高于阈值的，都被提除掉了。
那假设使用的是softNMS，框2和3的置信度就会被重新改写。2和1的iou较小，改写之后的置信度是0.4；3和1的iou较大，置信度会更低，大概是0.2。那假设筛选阈值正好是0.3，就恰好把2留下，把3踢出了。
但是，这里也有一个问题就是置信度的阈值如何选择？作者在这里依然使用手工设置的值，依然存在很大的局限性，所以该算法依然存在改进的空间。

针对这个问题，我也帮你们提前问了chatGPT，也给出了一个较为总结性的回答，如下所示。你们觉得它回答的如何呢？