OpenCv高阶(十八)——dlib人脸检测与识别

发布于:2025-05-28 ⋅ 阅读:(29) ⋅ 点赞:(0)


一、dlib库是什么?

dlib是一个适用于C++和Python的第三方库。包含机器学习、计算机视觉和图像处理的工具包,被广泛的应用于机器人、嵌入式设备、移动电话和大型高性能计算环境。是开源许可用户免费使用。

二、opencv库与dlib库的优缺点对比

1、opencv优缺点

优点
1)可以在CPU上实时工作;
2)简单的架构;
3)可以检测不同比例的人脸。

缺点
1)会出现大量的把非人脸预测为人脸的情况;
2)不适用于非正面人脸图像;
3)不抗遮挡。

2、dlib库优缺点

优点
1)适用于正面和略微非正面的人脸;
2)语法极简单
3)再小的遮挡下仍可工作。
缺点
1)不能检测小脸,因为它训练数据的最小人脸尺寸为80×80,较小尺寸的人脸数据需自己训练检测器;
2)边界框通常排除前额的一部分甚至下巴的一部分;
3)不适用于侧面和极端非正面,如俯视或仰视。

三、dlib库的安装

1、在线安装

pip install dlib –i 镜像地址

在这里插入图片描述
dlib官网:https://dlib.net/compile.html
在这里插入图片描述

2、本地安装

找到dlib库的whl文件进行安装,将whl文件下载到本地安装。
dlib资源: https://github.com/z-mahmud22/Dlib_Windows_Python3.x
在这里插入图片描述

四、dlib库的人脸检测器

dlib 提供 两种主流人脸检测器,适用于不同场景:

1. 基于 HOG 的检测器

detector = dlib.get_frontal_face_detector()  # 默认使用此方法

算法原理:

使用 方向梯度直方图 (HOG) 特征描述图像局部区域的梯度方向分布

结合 线性分类器 (SVM) 进行人脸判别

通过 图像金字塔 和 滑动窗口 实现多尺度检测

特点:

✅ 速度快:适合实时检测(CPU 上可达 30+ FPS)

✅ 轻量级:模型文件小(约 2MB)

⚠️ 局限性:对侧脸、遮挡人脸检测效果较差

2. 基于 CNN 的检测器

cnn_detector = dlib.cnn_face_detection_model_v1("mmod_human_face_detector.dat")

算法原理:

使用 卷积神经网络 (CNN) 进行端到端的人脸检测

需要预训练权重文件(需单独下载)

特点:

✅ 高精度:对侧脸、部分遮挡、复杂背景鲁棒性强

⚠️ 资源消耗大:需要 GPU 加速(CPU 上较慢)

⚠️ 模型文件较大(约 200MB)

在这里插入图片描述

五、dlib人脸检测的简单使用

1、导入必要库

import cv2       # OpenCV库,用于图像处理和显示
import dlib      # 机器学习库,用于人脸特征检测

2、初始化人脸检测器

# 使用dlib内置的基于HOG特征的方向梯度直方图人脸检测器
# 该检测器对正脸检测效果较好,返回人脸矩形坐标
detector = dlib.get_frontal_face_detector()

3、读取图像文件

# 从指定路径加载图像文件,OpenCV默认读取为BGR格式
img = cv2.imread("../data/pd.png")  

4、执行人脸检测

# 参数说明:
# 1. 输入图像(img)
# 2. 图像放大系数(4):通过上采样图像4次来检测更小的人脸
# 返回值:dlib.rectangle对象组成的可迭代对象,包含人脸区域坐标
faces = detector(img, 4)  

5、 遍历检测结果并标注

for face in faces:
    # 解析人脸矩形坐标:
    x1 = face.left()   # 人脸框左侧x坐标
    y1 = face.top()    # 人脸框顶部y坐标
    x2 = face.right()  # 人脸框右侧x坐标
    y2 = face.bottom() # 人脸框底部y坐标
    
    # 在图像上绘制绿色矩形框标注人脸
    # 参数说明:
    # 1. 目标图像
    # 2. 左上角坐标 (x1, y1)
    # 3. 右下角坐标 (x2, y2)
    # 4. 颜色 (BGR格式,此处为绿色)
    # 5. 线宽(2像素)
    cv2.rectangle(img, (x1, y1), (x2, y2), (0, 255, 0), 2)

6、显示检测结果

cv2.imshow('Face Detection Result', img)  # 创建显示窗口
cv2.waitKey(0)            # 等待任意按键(0表示无限等待)
cv2.destroyAllWindows()   # 关闭所有OpenCV窗口

在这里插入图片描述

总结

Dlib的人脸检测技术通过提供双引擎解决方案,在计算机视觉领域展现了独特的平衡艺术:其HOG检测器以轻量高效的特性(2MB模型、30+ FPS实时性)成为移动端和实时视频的首选,而CNN检测器凭借深度学习带来的高精度(支持多角度、复杂光照),在静态图像分析中树立了行业标杆。这种“鱼与熊掌兼得”的设计哲学,既解决了传统方法对硬件依赖的桎梏(HOG纯CPU运行),又通过模块化架构实现了从基础检测到人脸识别、姿态分析的生态延伸,堪称轻量级框架中兼顾速度与精度的典范。