在 PyTorch 生态中,训练目标检测模型(如 YOLOv5、Faster R-CNN)需要先对数据进行标注。以下是 6 款主流的 PyTorch 兼容标注工具,涵盖从简单到专业的解决方案。
1. LabelImg(最常用)
类型:图形化标注工具(支持 YOLO/VOC 格式)
特点:
开源免费,支持 Windows/Linux/macOS。
直接生成
.xml
(VOC) 或.txt
(YOLO) 文件。快捷键操作高效(W:画框,A/D:切换图片)。
安装:
pip install labelImg labelImg # 启动
适用场景:中小规模数据集,快速标注。
2. CVAT(计算机视觉标注工具)
类型:Web 端专业工具(支持团队协作)
特点:
支持目标检测、分割、关键点标注。
可导出 YOLO、COCO、Pascal VOC 格式。
支持视频帧标注和自动预标注(需部署服务器)。
安装:
docker-compose up -d # 使用 Docker 部署
访问:
http://localhost:8080
适用场景:企业级大规模标注,支持多人协作。
3. Roboflow(在线标注+增强)
类型:在线一站式平台(含数据增强)
特点:
无需安装,上传图片即可标注。
自动生成 YOLOv5/PyTorch 可直接使用的数据集。
内置数据增强(旋转、裁剪、亮度调整)。
网址:Roboflow 官网
适用场景:快速生成可直接训练的数据集,适合初学者。
4. LabelMe(支持多边形标注)
类型:MIT 开源的图形化工具
特点:
支持多边形标注(适合不规则物体)。
导出 JSON 格式(可转换为 COCO/YOLO)。
安装:
pip install labelme labelme # 启动
适用场景:需要精细标注(如医学图像、不规则物体)。
5. Makesense.ai(免费在线工具)
类型:零安装在线标注
特点:
完全免费,无需注册。
支持 YOLO、COCO、CSV 格式导出。
适合临时标注任务。
网址:makesense.ai
适用场景:临时小批量标注,无环境依赖。
6. VGG Image Annotator (VIA)
类型:牛津大学开发的轻量工具
特点:
单文件 HTML,无需安装。
支持导出 COCO 格式(需转换后供 PyTorch 使用)。
下载:VIA 官网
适用场景:学术研究,跨平台使用。
7. 标注工具对比表
工具 | 格式支持 | 安装难度 | 协作功能 | 适合场景 |
---|---|---|---|---|
LabelImg | YOLO, VOC | ⭐ | ❌ | 快速本地标注 |
CVAT | COCO, YOLO, VOC | ⭐⭐⭐ | ✅ | 企业级团队标注 |
Roboflow | YOLO, COCO | ⭐ | ✅ | 在线标注+数据增强 |
LabelMe | JSON (转 COCO) | ⭐⭐ | ❌ | 多边形标注 |
Makesense | YOLO, COCO | ⭐ | ❌ | 临时在线标注 |
VIA | COCO, CSV | ⭐ | ❌ | 学术研究/轻量级标注 |