图像形成与计算机视觉基础-EW帮帮网

1. 图像形成的基本原理

图像形成是物理世界与传感器（如胶片、CCD/CMOS）交互的过程，核心是光线的传播与记录。

1.1 直接放置胶片模型

物理原理：物体表面反射的光线直接照射到胶片上，但无任何遮挡或聚焦机制。
问题：所有物体点的光线会覆盖整个胶片，导致完全模糊（如图1）。

1.2 针孔相机模型

改进：在物体与胶片间加入针孔屏障，仅允许通过小孔的光线到达胶片（图2）。
关键参数：
- 孔径大小（d）：孔径越小，成像越清晰但亮度越低（需权衡信噪比）。
- 焦距（f）：针孔到胶片的距离，决定成像比例。

1.3 透镜模型

原理：透镜通过折射集中光线，替代针孔以提高亮度（图3）。
薄透镜公式：
1/f=1/u+1/v
- u：物距（物体到透镜的距离）
- v：像距（透镜到成像平面的距离）
景深（Depth of Field）：透镜允许一定范围内的物体清晰成像，与光圈大小成反比。

2. 投影几何与数学模型

2.1 透视投影（Perspective Projection）

2.2 仿射投影（Affine Projection）

2.3 消失点与消失线

3. 颜色空间与模型

3.1 RGB颜色空间

定义：通过红、绿、蓝三原色的叠加表示颜色（图6）。
缺点：
- 通道强相关：调整亮度需同时改变所有通道。
- 非线性感知：人眼对亮度的响应接近对数尺度，而RGB是线性的。

3.2 HSV/HSL颜色空间

组成：
- H（色相）：颜色类型（0°-360°）。
- S（饱和度）：颜色纯度（0%-100%）。
- V（明度）/L（亮度）：颜色明暗程度。
应用：图像编辑软件（如Photoshop）中的颜色选择器。

3.3 YCbCr颜色空间

分离亮度与色度：
- Y（亮度）：Y=0.299R+0.587G+0.114B
- Cb（蓝色色差）：Cb=0.564(B−Y)+128
- Cr（红色色差）：Cr=0.713(R−Y)+128
压缩优势：人眼对亮度更敏感，可对Cb/Cr进行子采样（如4:2:0）。

3.4 CIELAB颜色空间

4. 数字图像形成技术

4.1 空间采样（Spatial Sampling）

奈奎斯特采样定理：采样频率需大于信号最高频率的2倍，避免混叠（图7）。
- 示例：若图像最高空间频率为100 cycles/mm，则采样间隔需小于0.005 mm。
像素阵列：
x=j⋅Δx,y=k⋅Δy(j,k 为整数)

4.2 量化（Quantization）

位深度与灰度级：
- 8位：256级（JPEG标准）。
- 12位：4096级（医学影像）。
- 16位：65536级（专业摄影）。
量化误差：
误差=动态范围2n(n=位深度)

4.3 分辨率与存储权衡

空间分辨率：
- 人脸识别：64×64像素（约0.1MP）可满足基本需求。
- 高清显示：1920×1080像素（2MP）。
存储计算：
单张图像大小=宽×高×通道数×位深度单张图像大小=宽×高×通道数×位深度
- 示例：24位彩色图（3通道×8位），1024×768像素：
  1024×768×3×8=18,874,368 bits=2.36 MB

5. 空间域与变换域操作

- 定义：
  - 图像处理：输入图像 → 输出图像，目标是抑制失真、增强有用信息（如对比度调整、去噪）。
  - 图像分析：输入图像 → 提取特征/测量（如边缘检测、目标计数）。
  - 计算机视觉：输入图像 → 语义理解（如目标识别、场景重建）。
- 空间域操作：直接在像素值上进行处理，分为两类：
  - 点操作：单个像素独立变换，公式：
    g(x,y)=T(f(x,y))（如对比度拉伸、反转）g(x,y)=T(f(x,y))（如对比度拉伸、反转）
  - 邻域操作：基于像素周围区域计算，公式：
    g(x,y)=T(f(x,y),f(x+1,y),f(x−1,y),… )（如均值滤波）g(x,y)=T(f(x,y),f(x+1,y),f(x−1,y),…)（如均值滤波）

6. 点操作详解

6.1 对比度拉伸（Contrast Stretching）

6.2 阈值处理（Thresholding）

6.3 强度反转（Intensity Inversion）

6.4 对数与幂变换

7. 直方图处理

7.1 直方图均衡化（Histogram Equalization）

7.2 直方图规定（Histogram Matching）

8. 算术与逻辑操作

算术操作：
- 加法：多幅图像平均降噪（噪声方差降低 σ2NNσ2）。
- 减法：检测变化区域（如运动目标）。
逻辑操作：
- AND/OR：掩膜操作（提取特定区域）。
- XOR：检测差异（如边缘增强）。

9. 关键问题解析

10.总结

图像形成：从物理模型（针孔、透镜）到数学建模（透视/仿射投影）。

颜色科学：不同颜色空间适应不同需求（编辑、压缩、感知）。

数字化技术：采样与量化需平衡质量与效率，避免信息损失。

点操作：直接修改像素值，适合对比度调整和二值化。

直方图处理：通过分布调整优化全局或局部对比度。

算术操作：多用于图像融合与噪声抑制。

核心公式与算法：如Otsu阈值、直方图均衡化需熟练掌握推导与应用。

图像形成与计算机视觉基础

1. 图像形成的基本原理

1.1 直接放置胶片模型

1.2 针孔相机模型

1.3 透镜模型

2. 投影几何与数学模型

2.1 透视投影（Perspective Projection）

2.2 仿射投影（Affine Projection）

2.3 消失点与消失线

3. 颜色空间与模型

3.1 RGB颜色空间

3.2 HSV/HSL颜色空间

3.3 YCbCr颜色空间

3.4 CIELAB颜色空间

4. 数字图像形成技术

4.1 空间采样（Spatial Sampling）

4.2 量化（Quantization）

4.3 分辨率与存储权衡

5. 空间域与变换域操作

6. 点操作详解

6.1 对比度拉伸（Contrast Stretching）

6.2 阈值处理（Thresholding）

6.3 强度反转（Intensity Inversion）

6.4 对数与幂变换

7. 直方图处理

7.1 直方图均衡化（Histogram Equalization）

7.2 直方图规定（Histogram Matching）

8. 算术与逻辑操作

9. 关键问题解析

10.总结

网站公告

今日签到

热门文章

最新发布