目标检测中的核心评估指标mAP详解-EW帮帮网

《------往期经典推荐------》

项目名称	项目名称
1.【人脸识别与管理系统开发】	2.【车牌识别与自动收费管理系统开发】
3.【手势识别系统开发】	4.【人脸面部活体检测系统开发】
5.【图片风格快速迁移软件开发】	6.【人脸表表情识别系统】
7.【YOLOv8多目标识别与自动标注软件开发】	8.【基于深度学习的行人跌倒检测系统】
9.【基于深度学习的PCB板缺陷检测系统】	10.【基于深度学习的生活垃圾分类目标检测系统】
11.【基于深度学习的安全帽目标检测系统】	12.【基于深度学习的120种犬类检测与识别系统】
13.【基于深度学习的路面坑洞检测系统】	14.【基于深度学习的火焰烟雾检测系统】
15.【基于深度学习的钢材表面缺陷检测系统】	16.【基于深度学习的舰船目标分类检测系统】
17.【基于深度学习的西红柿成熟度检测系统】	18.【基于深度学习的血细胞检测与计数系统】
19.【基于深度学习的吸烟/抽烟行为检测系统】	20.【基于深度学习的水稻害虫检测与识别系统】
21.【基于深度学习的高精度车辆行人检测与计数系统】	22.【基于深度学习的路面标志线检测与识别系统】
23.【基于深度学习的智能小麦害虫检测识别系统】	24.【基于深度学习的智能玉米害虫检测识别系统】
25.【基于深度学习的200种鸟类智能检测与识别系统】	26.【基于深度学习的45种交通标志智能检测与识别系统】
27.【基于深度学习的人脸面部表情识别系统】	28.【基于深度学习的苹果叶片病害智能诊断系统】
29.【基于深度学习的智能肺炎诊断系统】	30.【基于深度学习的葡萄簇目标检测系统】
31.【基于深度学习的100种中草药智能识别系统】	32.【基于深度学习的102种花卉智能识别系统】
33.【基于深度学习的100种蝴蝶智能识别系统】	34.【基于深度学习的水稻叶片病害智能诊断系统】
35.【基于与ByteTrack的车辆行人多目标检测与追踪系统】	36.【基于深度学习的智能草莓病害检测与分割系统】
37.【基于深度学习的复杂场景下船舶目标检测系统】	38.【基于深度学习的农作物幼苗与杂草检测系统】
39.【基于深度学习的智能道路裂缝检测与分析系统】	40.【基于深度学习的葡萄病害智能诊断与防治系统】
41.【基于深度学习的遥感地理空间物体检测系统】	42.【基于深度学习的无人机视角地面物体检测系统】
43.【基于深度学习的木薯病害智能诊断与防治系统】	44.【基于深度学习的野外火焰烟雾检测系统】
45.【基于深度学习的脑肿瘤智能检测系统】	46.【基于深度学习的玉米叶片病害智能诊断与防治系统】
47.【基于深度学习的橙子病害智能诊断与防治系统】	48.【基于深度学习的车辆检测追踪与流量计数系统】
49.【基于深度学习的行人检测追踪与双向流量计数系统】	50.【基于深度学习的反光衣检测与预警系统】
51.【基于深度学习的危险区域人员闯入检测与报警系统】	52.【基于深度学习的高密度人脸智能检测与统计系统】
53.【基于深度学习的CT扫描图像肾结石智能检测系统】	54.【基于深度学习的水果智能检测系统】
55.【基于深度学习的水果质量好坏智能检测系统】	56.【基于深度学习的蔬菜目标检测与识别系统】
57.【基于深度学习的非机动车驾驶员头盔检测系统】	58.【太基于深度学习的阳能电池板检测与分析系统】
59.【基于深度学习的工业螺栓螺母检测】	60.【基于深度学习的金属焊缝缺陷检测系统】
61.【基于深度学习的链条缺陷检测与识别系统】	62.【基于深度学习的交通信号灯检测识别】
63.【基于深度学习的草莓成熟度检测与识别系统】	64.【基于深度学习的水下海生物检测识别系统】
65.【基于深度学习的道路交通事故检测识别系统】	66.【基于深度学习的安检X光危险品检测与识别系统】
67.【基于深度学习的农作物类别检测与识别系统】	68.【基于深度学习的危险驾驶行为检测识别系统】
69.【基于深度学习的维修工具检测识别系统】	70.【基于深度学习的维修工具检测识别系统】
71.【基于深度学习的建筑墙面损伤检测系统】	72.【基于深度学习的煤矿传送带异物检测系统】
73.【基于深度学习的老鼠智能检测系统】	74.【基于深度学习的水面垃圾智能检测识别系统】
75.【基于深度学习的遥感视角船只智能检测系统】	76.【基于深度学习的胃肠道息肉智能检测分割与诊断系统】
77.【基于深度学习的心脏超声图像间隔壁检测分割与分析系统】	78.【基于深度学习的心脏超声图像间隔壁检测分割与分析系统】
79.【基于深度学习的果园苹果检测与计数系统】	80.【基于深度学习的半导体芯片缺陷检测系统】
81.【基于深度学习的糖尿病视网膜病变检测与诊断系统】	82.【基于深度学习的运动鞋品牌检测与识别系统】
83.【基于深度学习的苹果叶片病害检测识别系统】	84.【基于深度学习的医学X光骨折检测与语音提示系统】
85.【基于深度学习的遥感视角农田检测与分割系统】	86.【基于深度学习的运动品牌LOGO检测与识别系统】

二、机器学习实战专栏【链接】，已更新31期，欢迎关注，持续更新中~~
三、深度学习【Pytorch】专栏【链接】
四、【Stable Diffusion绘画系列】专栏【链接】
五、YOLOv8改进专栏【链接】，持续更新中~~
六、YOLO性能对比专栏【链接】，持续更新中~

《------正文------》

目标检测比分类更难
精确度与召回率
- **精确度**
- **召回率**
IoU：检测质量的衡量标准
- 计算方式
- 为什么IoU阈值很重要
平均精度（AP）：曲线下面积
- 为什么AP很重要
mAP（Mean Average Precision）
mAP@0.5与mAP@0.95区别
为什么mAP是最终的评估指标
结论

本文将详细介绍，在目标检测模型（如YOLO、Faster R-CNN或SSD）中的核心核心评估指标mAP的相关概念。

目标检测比分类更难

在分类问题中，你只需预测一个标签。在目标检测中，必须：

找到对象所在的位置（定位：绘制边界框）。
确定对象是什么分类。

其评估指标包括精确度、召回率和mAP。

精确度与召回率

精确度

定义： 在你的模型检测到的所有物体中，有多少是正确的？

公式： True Positives / (True Positives + False Positives)

召回率

用于评估你的模型有多全面。定义：在所有存在的物体中，你的模型找到了多少？

公式： True Positives / (True Positives + False Negatives)

但是，仅仅靠精确度和召回率并不能说明全部问题。如果你的模型很擅长找物体，但画检测框的时候很糟糕怎么办？

这就是Intersection over Union（IOU）的由来。

IoU：检测质量的衡量标准

在这里插入图片描述
交并比（IoU）是衡量预测边界框与真实框（实际对象位置）对齐的准确程度的关键指标。它的工作原理如下：

计算方式

交集：预测框和真实框之间的重叠区域。
并集：两个方框所覆盖的总面积。

公式：IoU =相交面积/合并面积

举例来说：

如果你的模型预测出一个与真实框完全重叠的框，IoU = 1.0。
如果没有重叠，IoU = 0.0。
如果预测的盒子覆盖了一半的真实框，IoU = 0.5。

为什么IoU阈值很重要

1.IoU阈值（例如，0.5)作为检测的通过/未通过标准：

真阳性（TP）：IoU ≥阈值（例如，≥0.5）。
假阳性（FP）：IoU <阈值（例如，重叠面积太小了）。

2.满足不同的定制化需求

mAP@0.5是宽松的（框只需要50%重叠）。
mAP@0.75需要精确定位（75%重叠）。
mAP@0.95非常严格（用于医疗成像等安全关键任务）。

让我们来做比喻，想想IoU的门槛，比如考试的“及格分数”：

阈值为0.5就像得分50%通过（对大多数情况来说足够好）。
0.9的阈值就像需要90%才能通过（为精英表现保留）。

那么我们该如何解释模型的性能？我有Precision、Recall和IoU，但我该如何处理它们？

这就是平均精度（AP）的作用。

平均精度（AP）：曲线下面积

对于单个类（例如，“cat”），这就是你如何找到AP（精确率-召回曲线下的面积）：

一.按置信度对检测进行排序：从模型最高置信度的预测开始。

二.计算每一步的精确率召回率：当你沿着列表往下走（降低置信阈值）时，你：

提高召回率（找到更多对象，但有更多误报风险）。
降低精确度（更多检测，但有些可能是错误的）。

三.绘制精确-召回（PR）曲线：

X轴=召回率（0到1）。
Y轴=精确度（0到1）。
一个完美的模特有一个拥抱右上角的PR曲线。

四. 计算AP（PR曲线下面积）

AP将整个PR曲线总结为一个数字（0到1）。

对于平均精确度，AUC计算如下：

PR曲线通过在固定的召回率水平上插入精确度来“平滑”。
AP = 11个等间隔召回点（0.0，0.1，…，1.0）处的精确度值的平均值。
更简单的方法：使用原始PR曲线下的积分（面积）。

完美的PR曲线下面积= AP = 1.0（在所有召回水平下100%的准确率）。

为什么AP很重要

一.平衡精确度和召回率：高AP意味着模型：

检测大多数对象（高召回率）。
很少出错（高精度）。

二.可观察不同类别性能：AP是按类计算的。“猫”的低AP意味着你的模型对猫的检测效果不佳。

三.身份不可知：与固定阈值度量（例如，准确性），AP在所有置信水平上评估性能。

举例来说：

高平均精度（例如，0.9）

在每一个召回级别，精确度都很高。
如果模型检测到90%的对象（召回率=0.9），精确度仍然是90%。

低平均精度（例如，0.3）：

随着召回率的增加，精确度急剧下降。
检测到80%的对象（召回率=0.8）可能意味着准确率下降到20%。

mAP（Mean Average Precision）

mAP（Mean Average Precision） 是所有类别的平均值。

例如：如果模型检测到猫、狗和汽车，则mAP =（AP_cat + AP_dog + AP_car）/ 3。

mAP@0.5与mAP@0.95区别

mAP@0.5：

使用宽松的IoU阈值（50%重叠）。
在通用检测中常见（例如，PASCAL VOC数据集）。
支持检测对象的模型*，即使检测框稍微偏离*。

mAP@0.95：

使用严格的IoU阈值（95%重叠）。
支持具有接近完美定位的模型。
用于高风险应用（例如，医学成像、机器人学）。

COCO mAP：跨0.5到0.95（增量为0.05）的IoU阈值的mAP平均值。这是严与宽的平衡。

为什么mAP是最终的评估指标

平衡精确召回：与准确性不同，mAP会惩罚错过对象（低召回）或垃圾邮件错误检测（低精度）的模型。
根据需求设定IOU：通过使用IoU，mAP确保检测框不仅“足够好”，而且与您的门槛要求一样精确。

对于优先考虑速度和准确性的YOLO模型，通过mAP可以知道：

检测的可靠性（精度）。
错过的物体有多少（召回）。
边界框有多贴合（IoU）。

结论

目标检测是一项复杂的任务，评估其性能需要一个平衡精度，召回率和定位准确性的指标。这就是mAP的闪光点。它不仅仅是一个数字-它是一个全面的衡量模型检测对象、绘制边界框和处理多个类的能力的指标。

无论您使用的是YOLO、Faster R-CNN还是任何其他对象检测框架，mAP都能为您提供一个可靠的指标来比较模型、调整超参数，并将性能提升到一个新的水平。通过mAP@0.5和mAP@0.95等变量，您可以定制评估，以满足特定应用的精度要求。

在这里插入图片描述

好了，这篇文章就介绍到这里，喜欢的小伙伴感谢给点个赞和关注，更多精彩内容持续更新~~
关于本篇文章大家有任何建议或意见，欢迎在评论区留言交流！

目标检测中的核心评估指标mAP详解

目录