这里主要记录一下在学习ISP时遇到的一些名词。
图像质量(Picture Quality)
1.锐度(Acutance)
锐度常用于描述边界处图像信息过渡的快慢。高反差图像过渡速度非常快,可以形成非常明确的边缘,而低反差图像存在一定的过渡缓冲,表现在成像上就是模糊的边缘。
2.包围曝光AEB(Auto-Exposure Bracketing)
指一次拍摄后,以减少曝光值、中间曝光值、增加曝光值的方式,形成3张或者5张不同曝光量的照片。希望在这些不同曝光的照片中,能有比较接近摄影者所需要的曝光量,方便后期使用软件进行HDR合成。
3.测光模式(AE Metering Mode)
平均测光,也叫矩阵测光,这个测光模式使用率非常的高。它会把画面分成多个区域,然后对每个区域进行独立测光,这样就能计算出整个画面的测光平均值。平均测光模式适合拍摄大多数场景,但是有些时候就不是很适合了,比如:逆光环境,光差比很大的环境,画面中存在大面积阴影的时候等等,这些场景都是不适合的。这个模式能照顾到整个画面,兼顾亮部和暗部,最大保留画面的细节。中央重点测光,对整个画面进行测光,但中央区域占有较大比重。中央重点测光模式的理念是中间为主,四周为辅。一般用于拍摄建筑以及拍摄主体在中心部位而其他部位处于光线偏差较大的。如在走廊里拍摄故宫,纪念塔,又含有走廊部分。当拍摄主体不在画面的中央时,中央重点测光就不太好用了。局部测光,多用于光线不均匀,主体光线也不均匀的情况下,如拍黑夜里被光照射的葡萄。点测光就,对着画面中一个点进行测光,这个所谓的点就是取景范围1%-3%的区域,点测光模式的有点在于拍摄者可以根据自己认为对的地方进行测光。当在光线复杂的环境,比如逆光环境,光差大的环境下拍摄时就可以用点测光进行拍摄。
4.伪像
5.污点 (Blemish)
图像中的斑点,通常是由于sensor像素缺陷或sensor玻璃片清洁不良造成的。
6.散景(Bokeh)
散景效果主要是由镜头的光学特性产生的。当镜头聚焦在一个物体上时,来自该物体的光线会在相机的传感器(或胶片)上形成清晰的像。而来自焦点平面以外的物体的光线,经过镜头后不能准确地会聚在传感器上,从而形成模糊的光斑。
7.色差Chromatic aberration(CA)
色差又分横向(lateral)和纵向(longitudinal)两种色差效应。两种色差的基本原理都是由于镜头对不同波长折射率不同导致不同颜色的光不能会聚到同一点引起的。横向色差的常见效果是在图像存在明暗边界的地方出现“紫边”。纵向色差的效果是不同波长对应的焦平面不重合,导致图像模糊和出现伪彩色。
Chromatic aberration
定义与原理
Chromatic aberration(色差)是指在光学系统中,由于不同颜色(即不同波长)的光在折射或反射后不能聚焦在同一平面上而产生的成像缺陷。这是因为不同波长的光在通过透镜等光学元件时,其折射率不同。
例如,在一个简单的凸透镜中,根据折射定律,蓝光(波长较短)的折射率比红光(波长较长)的折射率高。因此,当一束包含多种颜色的光(如白光)通过透镜时,蓝光会比红光更快地会聚,导致它们在成像平面上的位置不同。这种位置差异就产生了色差。
色差的类型
纵向色差(Longitudinal Chromatic Aberration):也称为轴向色差。这种色差表现为不同颜色的光沿着光轴方向聚焦在不同的点上。例如,在相机镜头中,红光可能聚焦在离镜头较远的位置,而蓝光聚焦在较近的位置。这会导致图像在焦点处出现彩色的模糊,尤其是在拍摄高对比度的物体或者边缘锐利的物体时,这种模糊现象会更加明显。
横向色差(Lateral Chromatic Aberration):也称为倍率色差。它是指不同颜色的光在成像平面上的横向位置不同,导致物体的边缘出现彩色的镶边现象。例如,在拍摄白色物体的边缘时,可能会出现红色和蓝色的边缘,其中蓝光偏向一侧,红光偏向另一侧。这种色差与镜头的放大倍率有关,并且会随着物体离镜头中心的距离增加而变得更加明显。
色差在成像中的影响
降低图像清晰度:无论是纵向色差还是横向色差,都会使图像的清晰度下降。在纵向色差的情况下,由于不同颜色的光不能聚焦在同一平面上,图像中的细节会变得模糊不清。而横向色差产生的彩色镶边会干扰观察者对物体边缘的识别,使图像看起来不够锐利。
色彩还原不准确:色差会导致图像的色彩还原出现问题。因为不同颜色的光没有正确地会聚,所以拍摄的物体颜色可能会出现偏差。例如,在拍摄纯色物体时,可能会出现边缘变色的情况,使物体原本的颜色不能准确地呈现出来。
影响视觉体验:在高质量的摄影和光学设备应用场景中,色差会严重影响视觉体验。例如,在天文摄影中,色差可能会使星空照片中的星星出现彩色的光晕,降低照片的美感和科学性;在显微镜观察中,色差会干扰对微观物体结构的观察和分析。
色差的校正方法
光学材料选择与镜头设计
在镜头制造过程中,选择具有特殊色散特性的光学材料可以有效减少色差。例如,使用萤石(CaF₂)或低色散玻璃(如 ED 玻璃,即 Extra - Low Dispersion 玻璃)来制造镜头。这些材料能够使不同波长的光在通过镜头时的折射率差异减小,从而降低色差。
优化镜头的光学结构也是减少色差的重要方法。通过合理设计镜头的镜片组合,如采用双胶合透镜或多片透镜组合,利用不同镜片的色散特性相互补偿,可以有效地校正色差。例如,将一片正透镜和一片负透镜胶合在一起,使它们的色散相互抵消,从而在一定程度上减少色差。
数字图像处理校正
在数字图像领域,也可以通过软件算法来校正色差。例如,通过分析图像中颜色的分布和边缘的彩色镶边情况,利用色差的数学模型,对图像进行后期处理。这种方法通常包括检测边缘的色差程度、计算校正量,然后对图像的颜色通道进行调整。一些高级的图像编辑软件和相机的图像信号处理(ISP)单元都提供了色差校正功能。
8.颜色准确度(Color accuracy)
摄像机实际捕捉到的颜色值与理想值之间的差异,可以用SMI指数(Sensitivity Metamerism Index)进行定量评估,该指数基于ColorChecker 24色卡的1~18色块的平均色差作为基础标准。
100: correct values for all color patches,(所有颜色都准确)
90: state-of-the-art excellence,(先进的)
85: pretty good,(相当好)
80: decent,(像样的)
75: unacceptable
9.色域(Color gamut)
色域是显示器可以显示或相机可以记录的可见颜色的子集,它由白点、位深度和一组原色(通常为三个:红色、绿色、蓝色)定义。高清色彩 (BT.709) 覆盖了 35.9% 的全可见色域。UHD(BT.2020)将此范围扩展到75.8%。
10.颜色阴影(Color shading)
纵向色差的一种表现形式,图像的中心与四周存在渐变色差,且色差的形式与照明色温有关。
11.串扰(Crosstalk)
原本应属于某一个像素的光子或光生电子有一定概率可以扩散到周围像素,形成一种噪声机制。Crosstalk Remove 是ISP 中的一个功能模块,主要用于平衡 raw data 之间临近像素 Gr 和 Gb 之间的差异,能够有效防止 demosaic 插值算法产生的方格或其他类似 pattern。
12.色调(Color tone)
关于图像颜色的整体评价,偏红,偏绿,偏蓝
13.等高线效应(contour effect)
也称条带效应(banding effect),当渲染系统精度不足时,连续过渡的图像被四舍五入变成不连续的图像,存在亮度(luma)和色度(chroma)两种情况。
14.对比度(Contrast)
对比度是衡量一幅图像中最亮像素与最暗像素的差异的一个指标,用公式表示为Contrast=(Imax-Imin)/(Imax+Imin)对比度低的图像看起来“灰蒙蒙”的(dull),因为主要的像素都集中在灰色附近,如下图(左)所示。对比度高的图像有亮有暗,看起来比较“通透”(clarity),图像的直方图分布比较均匀地延展到上下限,如下图右)所示。
15.坏点校正(DPC)
坏点指的是CMOS传感器上不能正常进行光电转换的像点坏点校正是指使用某种软件算法检测图像中的坏点,并使用某种插值算法对坏点进行修正,以降低坏点对图像质量的影响。
16.动态范围(Dynamic range)
一个信号系统的动态范围被定义成最大不失真电平和噪声电平的比值。对于图像来说,动态范围表示图像中所包含的从“最暗”至“最亮”的取值范围,可以用F-stop数表示。一幅图像的动态范围可以用ST-52测试卡定量地测量。
17.钳位(Clipping)
当摄像机动态范围不足以记录场景的最大或最小亮度时,图像就会产生失真,失真的像素值被钳位(clip)到设备能够表达的最大或最小值。
18.眩光(Flare)
画面中出现的高光区域的现象,是一种图像质量问题,产生flare的主要原因通常是相机的动态范围不足。
Flare 有时特指一种全局性的高光现象,此时称为面纱眩光(veiling glare),这是一种严重的图像质量问题,产生的原因是入射光线在镜片和镜筒内壁上多次发生反射(reflection)和散射(scattering),形成照度相对均匀的全局性杂散光源,从而拉高了图像的最小像素值,降低了图像的对比度,使图像看起来雾蒙蒙的。当场景中有强光存在时(如夜间移动中的车灯),图像中还可能出现漂浮的鬼影。
19.伽马(Gamma)
1.Gamma 的定义与概念
在 ISP(图像信号处理器)中,Gamma 是一种用于对图像亮度进行非线性校正的参数。它描述了输入信号(通常是图像传感器捕获的原始亮度信号)与输出信号(经过处理后显示或存储的亮度信号)之间的幂律关系。具体来说,Gamma 校正的公式可以简单表示为,其中是输入亮度值,是输出亮度值,是 Gamma 值。
2.Gamma 在图像显示中的作用
亮度感知的优化:人的视觉系统对亮度的感知是非线性的。Gamma 校正可以使图像的亮度分布更符合人眼的视觉特性。Gamma 值为 2.2 或 2.4 的幂函数曲线能够较好地模拟这种人眼视觉特性。例如,在没有 Gamma 校正的情况下,图像中较暗的区域可能看起来过于暗淡,而较亮的区域可能过于刺眼。通过适当的 Gamma 校正,能够让暗部细节更清晰可见,同时亮部也不会过于曝光,从而提升图像的整体视觉效果。
显示设备的适配:不同的显示设备(如显示器、电视、投影仪等)具有不同的 Gamma 特性。Gamma 校正可以帮助图像在各种显示设备上都能呈现出较为一致的亮度和对比度。例如,计算机显示器通常采用的 Gamma 值约为 2.2,而电视可能采用的 Gamma 值约为 2.4。通过在 ISP 中进行合适的 Gamma 校正,可以确保图像在不同设备上显示时,其亮度和对比度能够尽可能地接近原始拍摄或制作意图。
3.Gamma 对图像编码和存储的影响
优化数据存储和传输:在图像编码过程中,Gamma 校正可以对亮度数据进行有效压缩。由于人眼对亮度的感知是非线性的,通过 Gamma 校正后的亮度数据在进行编码(如 JPEG 编码)时,可以利用这种非线性特性,在不明显损失视觉质量的情况下,更高效地压缩图像数据。这样可以减少图像存储所需的空间和传输所需的带宽。
色彩准确性的维护:除了亮度校正,Gamma 还与色彩准确性有关。在 RGB 色彩空间中,改变 Gamma 值会影响颜色的亮度分量,进而影响整个色彩的呈现。正确的 Gamma 校正可以确保色彩在不同亮度水平下的准确性和一致性,避免因亮度变化而导致的色彩偏差。
4.Gamma 值的调整和应用场景
小于 1 的 Gamma 值:例如,当 Gamma 值为 0.5 时,会使图像的暗部更亮,亮部更暗,呈现出一种 “提亮暗部、压低亮部” 的效果。这种情况可能用于一些特殊的艺术创作或者需要增强暗部细节的场景,如在低光摄影作品后期处理中,适当降低 Gamma 值可以让原本较暗的细节更加明显。
等于 1 的 Gamma 值:此时图像的亮度呈线性关系,输入和输出亮度基本一致。这种情况很少直接用于显示目的,但在一些图像处理的中间步骤或者特定的科学研究场景中,可能会用到线性的亮度关系。
大于 1 的 Gamma 值:如 Gamma 值为 2.2(常见于计算机显示器),会使图像的亮部更亮,暗部更暗,增强了图像的对比度。这在大多数日常图像显示和观看场景中是比较常用的,可以让图像看起来更加生动、鲜明。
根据拍摄和显示环境调整 Gamma:在拍摄日出日落等大光比场景时,适当的 Gamma 校正可以帮助平衡天空和地面的亮度,使整个画面的亮度层次更加丰富。而在将图像用于电影放映时,需要根据电影院投影仪的 Gamma 特性来调整图像的 Gamma 值,以获得最佳的观影体验。
针对视频或静态图像中的亮度(luminance)或RGB三刺激值采用的非线性映射,可进一步分为编码伽马(摄像设备)和解码伽马(显式设备)。
伽马校正的效果
20.多帧融合宽动态(Frame stitch HDR mode)
ISP 支持HDR功能的一种模式,ISP读取若干帧不同曝光值的图像并合成一帧HDR图像。
21.眩光(Glare)
强光在镜头内各个镜片间多次反射引起的,眩光的强度和颜色与镜头镀膜种类和质量有关。
22.几何畸变(Geometric distortion)
直线投影原理要求物方的直线经光学系统投影到像方后仍然是直线。几何畸变是相对直线投影原理的偏离。两种常见的畸变形式是桶形(barrel)和枕形(pincushion)畸变
23.绿平衡 (GE)
由于感光器件制造工艺和电路问题,Gr,Gb数值可能存在差异,图像出现格子迷宫现象。用均值算法处理Gr,Gb通道存在的差异,同时保留高频信息。Green Equalization,校正Gr 与Gb 两个通道的失衡,提高部分场景的图像质量。
- 从视觉上看,可能会有规律或无规律的小方块(格子)状图案,这些小方块之间的颜色过渡不自然,形成一种类似迷宫路径一样错综复杂的视觉感受。就好像图像被分割成了许多小块,这些小块的颜色和周围的小块不协调,给人一种混乱、破碎的视觉体验。
产生原因推测
这种现象的根本原因是感光器件的制造工艺瑕疵和电路问题。在图像传感器中,Gr 和 Gb 通道是用于捕捉和处理绿色成分信息的不同通道,正常情况下它们应该协同工作来准确地还原绿色信息。然而,当制造工艺不够精确或者电路出现干扰、信号传输不一致等情况时,Gr 和 Gb 通道接收到的信号强度、数值就会产生差异。例如,可能在某个区域 Gr 通道的信号比 Gb 通道强,而在相邻区域情况又相反,这就会导致像素点之间的绿色成分在色彩和亮度上出现不一致,进而形成格子状的色彩混乱图案。
24.直方图(Histogram)
直方图是对图像的一种统计方法,常用有亮度直方图(针对luma分量)以及通道直方图(针对RGB分别统计),对于每个像素值(Luma或R/G/B值)。
25.热像素(Hot Pixels)
一种sensor噪声形式,在长曝光、高增益条件下某些像素呈现为明显的颜色噪声,主要成因是电子的热激发,通常是蓝色像素问题更加突出。
26.色温(Lighting temperatures)
一个理想黑体在不同温度下会呈现不同的颜色,温度大于5500K(5000 C)时颜色偏蓝(冷),低于5500K时颜色偏红(暖)。如果一个光源与黑体在温度T下发射的光谱一致或较接近,则称该光源的色温为T,单位为Kelvin。
常用的光源和色温有A光源,2850K,一种白炽灯D65,6500K,模拟日光,
27.线性模式(Linear mode)
线性一词的具体含义是sensor RAW图像的编码值(code value / digital number)与入射到sensor的光信号强度成正比,可以简单理解为每个像素的DN值与入射到该像素的光子数成正比)。
ISP处理一帧曝光的图像时称为线性模式。
图像进入ISP后,如果经历了非线性变换,如gamma,LUT等,则输出的图像不再是线性图像。
28.Log模式
单反、电影机等camera支持的一种拍摄模式,主要功能是将12或14比特位深的宽动态数据压缩到10比特位深,以便于存储和处理。Log视频由于进行了位宽压缩所以在普通显示设备上播放时对比度很低,色调是灰蒙蒙的,称为灰片,需要经过调色(grading)处理后才能变成正常的颜色。
索尼的 S-Log、佳能的 C-Log
29.调色(Grading)
使用DaVinci之类的调色软件对以LOG格式录制的视频进行渲染和创作,提升饱和度和对比度。
30.噪声(Noise)
图像中不受欢迎的随机变化的信号,噪声会导致辨识信息困难。
31.降噪(Noise reduction)
图像降噪(均值滤波、中值滤波、高斯滤波、双边滤波、小波降噪)
32.曝光过度(Overexposure)
曝光过度的表现是图像直方图中有显著比例的像素位于亮区
33.曝光不足(Underexposure)
曝光不足的表现是图像直方图中有显著比例的像素位于阴影区
34.透视畸变(Perspective distortion)
perspective(透视法,远景展望)
distortion(变形扭曲,歪曲曲解)
透视畸变是由于被摄物体距离镜头远近不同引起的一种变形,距离镜头远的物体显得小,距离镜头近的物体显得大。
透视畸变在人像摄影中称为“大鼻子”现象,因为鼻子离镜头近,显得特别大。
调整方法:调整拍摄角度和位置**选择合适的镜头焦距
35.紫边(Purple fringing)
由镜头色差引起的一种成像缺陷,表现为在画面明暗交界区曲线紫色或其它颜色的光晕。
使用高质量镜头:选择色差校正较好的镜头可以有效减少紫边的出现。一些高端镜头采用了特殊的光学材料和复杂的光学结构来降低色差。例如,使用低色散玻璃(如萤石镜片、ED 镜片等)的镜头,能够更好地将不同颜色的光线聚焦在同一平面上,从而减少紫边。
调整拍摄参数:合理调整曝光参数可以避免过度曝光导致的紫边。通过降低曝光补偿或者缩小光圈,减少进入镜头的光线量,特别是在高光部分的光线强度,从而减轻紫边现象。此外,改变拍摄角度或者光线条件,避免高对比度边缘直接受强光照射,也可以在一定程度上减少紫边
36.天空偏紫(Purple sky)
一种曝光问题导致的伪彩色。当RAW数据已经饱和时,如果白平衡增益处理不当,则过曝的像素容易变成紫色,一般是因为不正确的归一化操作引起的。
37.相对照度(Relative illumination)
也叫暗角(vignetting)光衰减(light falloff)
用于衡量图像亮度从中心到四角的变化程度。暗角通常是由镜头能量衰减引起的,与sensor本身的像素结构也由一定关系。
38.饱和度(Saturation)
颜色饱和度取决于该色中含色成分和消色成分(灰色)的比例。含色成分越大,饱和度越大;消色成分越大,饱和度越小。因此颜色饱和度取决于光辐射强弱以及光谱分布。若光源是单一波长且光辐射很强则具有高的色饱和度,如激光。当光辐射强度降低时饱和度亦降低。人类视觉对每种色彩的饱和度可以分辨20个等级。一般将ColorChecker 24色卡作为100%饱和度的参考标准。
39.空间频率响应(SFR)
空间频率响应Spatial Frequency Response,也称Modulation Transfer Function(MTF),推荐使用斜边(slanted edge)图案进行测试。
空间频率响应(Spatial Frequency Response)和调制传递函数(MTF)的概念
定义:空间频率响应是描述成像系统(如相机镜头、显示器等)对不同空间频率的输入信号(如明暗交替的线条图案)的响应能力。它反映了系统能够多好地再现细节以及对比度随空间频率的变化情况。调制传递函数(MTF)是空间频率响应的一种量化表示方式,它是衡量成像系统成像质量的重要指标。MTF 的值介于 0 和 1 之间,值越高表示成像系统对相应空间频率的信号传递能力越强,成像质量越好。
重要性:通过分析空间频率响应或 MTF,我们可以了解成像系统在再现细节和对比度方面的性能。例如,对于相机镜头来说,高空间频率下的 MTF 值可以告诉我们镜头在拍摄精细纹理(如毛发、树叶脉络等)时的清晰度和对比度表现;对于显示器,MTF 有助于评估其显示微小元素(如文字、图标细节)的能力。
斜边(slanted edge)图案测试的原理和优势
原理:斜边图案是一种由亮区到暗区逐渐过渡的图案,通常呈现一定的倾斜角度。在测试成像系统时,当这个斜边图案通过成像系统成像后,通过分析图像中斜边的边缘响应,可以得到成像系统的空间频率响应。具体来说,通过对斜边边缘处的亮度变化进行数学分析(如傅里叶变换等方法),可以计算出不同空间频率下的调制传递函数。因为斜边图案包含了连续变化的空间频率信息,从低频(斜边的整体倾斜部分)到高频(斜边边缘的细节部分)都有涉及,所以能够全面地测试成像系统的性能。
40.斜边(Slanted Edge)
评估相机MTF曲线时,为了防止测试图案的边缘刚好与某行(列)像素重合的情况,一般将测试图案倾斜5~10度,保证斜边会跨越一定数量的像素。
41.锐化(Sharpen)
为了补偿图像捕捉和降噪过程中图像细节的损失,需要使用一定的算法对图像进行锐化处理以还原图像的细节。
42.信噪比Signal to Noise Ratio(SNR)
信噪比是信号功率与噪声功率的比值。单一图像可衡量其空域信噪比,相邻几帧图像之间可衡量时域信噪比。
43.白平衡(White Balance)
白平衡是一种用于调整图像或视频颜色的技术,目的是确保白色物体在各种光照条件下都能正确地呈现为白色。在不同的光源下,白色物体可能会因为光线颜色的差异而看起来带有某种颜色倾向。
相机或图像设备的白平衡功能通过改变红(R)、绿(G)、蓝(B)三种颜色通道的增益来补偿不同色温下的颜色偏差。
44.AWB自动白平衡(Auto White Balance)
(1)工作机制
色温估计:自动白平衡系统首先会对场景的色温进行估计。色温是用开尔文(K)来衡量光源颜色特性的一个指标。例如,低色温(如 2700 - 3000K)的光源,像钨丝灯,发出的光偏黄、偏暖;而高色温(如 5500 - 6500K)的光源,如日光,光的颜色偏蓝、偏冷。相机或设备通过分析图像传感器接收到的光线信息来推测场景的色温。它会查看不同颜色通道(红、绿、蓝)的亮度和比例关系。比如,如果红色通道的亮度明显高于蓝色通道,可能意味着场景处于低色温(偏暖)的光源下。
增益调整:在确定了色温估计后,自动白平衡会调整红、绿、蓝三个颜色通道的增益。增益调整本质上是改变每个颜色通道的信号强度。如果推测场景处于偏暖(低色温)的光源下,就会增加蓝色通道的增益,同时可能适当降低红色通道的增益,使三种颜色通道达到新的平衡,让白色物体在图像中呈现出真正的白色。这个过程是通过复杂的算法实现的,不同设备制造商的算法可能会有所不同,但基本原理都是围绕着色彩平衡展开的。
(2)不同设备中的实现方式差异
相机设备
消费级数码相机:这些相机中的自动白平衡算法通常会预设多种常见的光源模式。例如,当相机检测到场景类似于钨丝灯照明(通过光线颜色和亮度分布等特征),就会调用预先设定好的钨丝灯白平衡模式,快速调整颜色通道增益。一些高端消费级相机还会结合场景分析技术,对画面的主体和背景分别进行色温估计,以获得更准确的白平衡效果。
单反相机和无反相机:这类相机的自动白平衡系统相对更复杂。它们除了具有基本的预设模式外,还会利用传感器的更多特性来估计色温。例如,通过对传感器不同区域的光线采样,更精确地分析光线的颜色变化。而且,这些相机通常允许用户在自动白平衡的基础上进行微调,以满足专业用户对色彩的特殊需求。
手机设备
手机摄像头的自动白平衡主要是为了满足用户在各种日常场景下的快速拍摄需求。手机厂商会采用一些轻量级但高效的算法。它们会结合手机的其他传感器(如环境光传感器)来辅助估计色温。同时,为了在不同的拍摄模式(如人像、风景、夜景等)下都能有较好的白平衡效果,手机会针对不同模式优化自动白平衡算法。例如,在夜景模式下,会更注重还原灯光的真实颜色,同时避免过度校正导致画面偏冷。
(3)影响自动白平衡准确性的因素
复杂光源环境:如前面提到的混合光源场景,当有多种不同色温的光源同时照射在拍摄场景时,自动白平衡很难准确判断应该以哪种光源的色温为标准进行调整。例如,在一个室内场景中,既有暖黄色的台灯,又有从窗户透进来的冷蓝色的日光,相机的自动白平衡可能会出现色彩还原不准确的情况。
特殊颜色的物体占比过大:如果画面中某种特殊颜色的物体占据了大部分面积,自动白平衡可能会受到误导。例如,在拍摄一片大面积红色花海时,相机可能会错误地将红色调判断为是由于光源色温导致的,从而过度调整白平衡,使画面的其他颜色出现偏差。
光线强度的极端变化:在光线过强(如拍摄太阳直射的物体)或过弱(如在很暗的环境中)的情况下,自动白平衡的准确性也可能会受到影响。因为在这些极端情况下,传感器接收到的光线信息可能会超出正常范围,导致色温估计错误。
44.CCM色彩校正矩阵(Color Correction Martix)
(1)CCM 的定义与概念
CCM 是色彩校正矩阵(Color Correction Matrix)的简称。在图像调试领域,它是一种用于精确调整图像色彩的工具。其主要作用是通过一个 3x3 的矩阵乘法运算,对图像的红(R)、绿(G)、蓝(B)三个颜色通道进行线性变换,从而纠正图像的色彩偏差,使图像色彩更加准确和符合预期。
(2)CCM 在图像调试中的作用
色彩准确性校正:在实际的图像采集过程中,由于相机传感器的特性、光照条件等多种因素的影响,图像可能会出现色彩不准确的情况。例如,在不同的光源下,白色物体可能会出现偏色现象。CCM 可以通过调整系数,使得白色在各种光照条件下都能准确地呈现为白色,同时也能对其他颜色进行精准校正,让图像的色彩还原更接近真实场景。
色彩风格调整:除了校正色彩偏差,CCM 还可以用于实现特定的色彩风格。例如,在电影制作或摄影后期处理中,通过调整 CCM 矩阵的系数,可以营造出暖色调(如增加红色和黄色成分)或冷色调(如增加蓝色成分)的色彩风格,或者模拟出复古风格、日系清新风格等不同的色彩效果。
多设备色彩一致性调整:在涉及多个图像采集设备(如多个相机)或者图像显示设备(如不同的显示器)的场景中,CCM 可以帮助实现色彩一致性。由于不同设备的色彩特性不同,通过为每个设备计算合适的 CCM 并应用,可以使它们在呈现相同图像时,色彩更加接近,确保在不同设备间传递和展示图像时的色彩统一性。
(3)如何确定 CCM 系数
理论计算方法:可以基于色彩空间转换理论来计算 CCM 系数。例如,已知标准色彩空间(如 sRGB)和实际设备的色彩空间之间的转换关系,通过数学推导和计算可以得到 CCM 系数。这种方法需要对色彩空间理论有深入的理解,并且要知道设备的色彩空间特性参数,如色域范围、色坐标等。
测量和校准方法
使用色卡:这是一种常用的方法。通过拍摄或显示已知颜色的色卡(如 X - Rite 色卡),色卡上有标准的颜色值。然后将采集到的色卡图像颜色值与标准值进行对比,利用最小二乘法等数学优化算法,计算出能够使采集颜色值最接近标准值的 CCM 系数。
专业仪器测量:使用色彩测量仪器(如分光光度计)对设备的色彩输出进行测量。这些仪器可以精确地测量出设备在不同颜色刺激下的色彩响应,然后根据测量数据来计算 CCM 系数。这种方法精度高,但仪器成本也相对较高。
CCM 在不同设备和场景中的应用
相机设备:在相机的图像信号处理(ISP)流程中,CCM 通常位于白平衡调整之后。白平衡主要是纠正由于光源色温导致的色彩偏差,而 CCM 在此基础上进一步精细调整色彩。例如,在拍摄风景照片时,通过调整 CCM 可以增强天空的蓝色和植被的绿色,使照片的色彩更加鲜艳。
显示器设备:对于显示器,CCM 可以用于校准显示器的色彩显示。在生产过程中,通过测量显示器的色彩输出并应用 CCM,可以确保显示器能够准确地显示各种颜色。在图形设计、视频编辑等专业场景中,用户也可以通过调整显示器的 CCM 来匹配特定的色彩标准(如 Adobe RGB),以保证作品的色彩准确性。
45.ISO
它本质上是衡量相机图像传感器(CMOS 或 CCD)对光线敏感程度的指标。ISO 数值越高,图像传感器对光线越敏感。例如,ISO 100 时,传感器对光线的敏感度较低;当 ISO 提升到 800,传感器在相同光照条件下能够捕捉到更多的光线信号。
1.ISO 的工作原理
当提高 ISO 值时,相机实际上是在对图像传感器接收到的信号进行放大。以一个简单的例子来说明,在低 ISO 设置下,图像传感器接收到一定量的光子并将其转换为电信号,这些电信号比较微弱。当提升 ISO 后,相机内部的电路会对这些电信号进行放大处理,从而使图像变亮。然而,这种放大并非没有代价。因为在放大电信号的过程中,同时也会放大信号中的噪声,导致图像质量下降。
2.ISO 对画质的影响
低 ISO 画质特点:在较低的 ISO 值(如 ISO 100 - 200)下,图像的画质通常较好。由于传感器接收到的信号没有经过过多的放大,所以图像中的噪点较少,色彩还原度高,细节丰富。这使得在光线充足的情况下,拍摄的照片能够呈现出细腻的质感,比如在晴天拍摄风景照,使用低 ISO 可以获得色彩鲜艳、细节清晰的图像。
高 ISO 画质特点:随着 ISO 值的升高,画质会逐渐下降。当 ISO 达到较高数值(如 ISO 1600 以上)时,图像中的噪点会明显增多,这些噪点可能表现为颗粒状或者彩色的斑点,使图像看起来粗糙。同时,高 ISO 还可能导致色彩偏差和细节丢失。例如,在较暗的环境中,如果使用高 ISO 拍摄,照片中的暗部区域可能会出现色彩失真,并且原本细腻的纹理也会变得模糊不清。
3.ISO 在不同拍摄场景中的应用
光线充足的场景:如户外阳光明媚的环境,一般使用较低的 ISO(通常为 ISO 100 - 400)。这样可以保证画质的细腻,同时利用光圈和快门速度来控制曝光。例如在拍摄风景时,低 ISO 配合小光圈可以获得大景深,使整个画面从前景到背景都清晰锐利。
低光场景:在光线较暗的环境中,如室内光线不足或者夜景拍摄,可能需要提高 ISO 来获得足够亮的图像。但是为了平衡画质和亮度,需要谨慎选择 ISO 值。如果有三脚架等辅助设备,可以适当延长曝光时间,保持较低的 ISO 以确保画质。如果手持拍摄,可能需要提高 ISO,但尽量控制在设备能够接受的画质损失范围内,同时配合光学防抖或电子防抖功能,减少因手持抖动而产生的模糊。例如在拍摄室内舞台表演时,由于不能使用闪光灯且演员动作较快,可能需要适当提高 ISO 来捕捉清晰的瞬间。
46.色彩查找表CLUT(Color Look Up Table)
CLUT 是色彩查找表(Color Look - Up Table)的缩写。它是一种用于快速色彩转换的工具,本质上是一个预先定义好的表格,存储了输入颜色值与输出颜色值之间的映射关系。
通常,CLUT 是一个多维数组。以最常见的 RGB 色彩空间为例,一个简单的 CLUT 可以是一个三维数组,其中每个维度对应于红(R)、绿(G)、蓝(B)通道。数组中的每个元素存储了经过转换后的颜色值,其索引是由原始的 RGB 颜色值构成。例如,对于一个 8 位的 RGB 色彩空间(每个通道有 256 个可能的值),CLUT 的大小可以是 256×256×256。
CLUT 在图像色彩转换中的作用
高效的色彩空间转换:在不同的色彩空间之间进行转换时,直接计算转换公式可能会非常复杂和耗时。CLUT 提供了一种快速的替代方法。例如,从 sRGB 色彩空间转换到 Adobe RGB 色彩空间,通过预先计算好的 CLUT,可以直接查找输入颜色在新色彩空间中的对应值,而无需每次都进行复杂的数学公式运算。
色彩风格调整:CLUT 可以用于实现各种色彩风格的转换。比如,从自然色彩风格转换为复古色彩风格或者电影色彩风格。通过构建合适的 CLUT,将原始图像的颜色值与具有特定风格的颜色值进行映射,可以快速改变图像的色彩风格。在电影制作、游戏开发和摄影后期处理等领域,这种方法被广泛用于营造特定的视觉氛围。
色彩校正与匹配:在确保不同设备或系统之间的色彩一致性方面,CLUT 也发挥着重要作用。例如,当图像在不同显示器上显示时,由于每个显示器的色彩特性不同,通过使用 CLUT 可以校正图像的色彩,使其在各个显示器上显示出相近的色彩效果。
CLUT 的构建与应用场景
构建方法
基于色彩空间转换公式:如果知道从一种色彩空间到另一种色彩空间的精确转换公式,可以通过对整个色彩空间进行采样,计算每个采样点的转换后颜色值,然后构建 CLUT。例如,对于线性 RGB 到 sRGB 的转换,可以根据 sRGB 的非线性转换公式,对 RGB 空间中的所有可能值进行计算,将结果存入 CLUT。
基于色彩样本和插值:可以收集一系列已知的色彩转换样本,例如,通过测量或计算得到一些关键颜色在不同色彩空间或风格下的转换值。然后,使用插值算法(如双线性插值、三线性插值等)来填充 CLUT 的其他值。这种方法在无法获取精确转换公式或者转换过程比较复杂的情况下非常有用。
应用场景
视频游戏开发:游戏中的实时渲染需要快速的色彩处理。CLUT 可以用于实现不同的游戏场景风格,如白天场景和夜晚场景的色彩转换,或者模拟不同天气条件下的色彩效果。通过在渲染管道中应用 CLUT,可以在不增加太多计算成本的情况下,快速改变游戏画面的色彩。
电影制作和后期处理:在电影调色过程中,CLUT 可以用于快速预览和应用不同的色彩风格。调色师可以创建一系列的 CLUT 来模拟不同胶片类型的色彩效果或者著名电影的色彩风格。在将电影转换为不同的发行格式(如从电影院版本转换为家庭视频版本)时,CLUT 也可以用于确保色彩的一致性。
医学图像处理:在医学图像(如 X 光、CT、MRI 图像)的显示中,CLUT 可以用于增强特定组织或结构的可视性。例如,通过构建一个 CLUT,将特定组织的灰度值映射到更明显的颜色,从而帮助医生更容易地识别病变区域。
47.Bayer域
定义与概念
Bayer 域(Bayer domain)是指在数字图像传感器(特别是 CMOS 和 CCD 传感器)输出数据的一种色彩滤波阵列(CFA - Color Filter Array)形式。Bayer 阵列是最常见的 CFA 类型,它以其发明者布莱斯・拜耳(Bryce Bayer)的名字命名。在 Bayer 阵列中,图像传感器的像素被覆盖上不同颜色的滤镜,通常是红(R)、绿(G)、蓝(B)三种颜色。其排列方式是一种有规律的马赛克图案,绿色像素占比最高,约为 50%,红色和蓝色像素各占约 25%。例如,一种常见的 Bayer 阵列排列可能是RGGB:
这样的排列方式是基于人眼对绿色敏感度最高的视觉特性,通过更多的绿色像素来获取更准确的亮度信息,同时利用红、蓝像素来获取色彩信息。
数据特点与用途
数据特点
由于 Bayer 阵列的像素只记录了一种颜色信息(R、G 或 B),所以从传感器输出的原始数据是一种不完整的色彩信息。例如,在一个 Bayer 域图像中,每个像素位置只有一种颜色值,要么是红色,要么是绿色,要么是蓝色,而不是完整的 RGB 值。
这种数据具有马赛克特性,即图像看起来像是由彩色的小方块组成的马赛克图案。并且,数据的空间分辨率在色彩通道上是不均衡的,绿色通道的分辨率相对较高,而红色和蓝色通道的分辨率相对较低。
用途
图像采集的第一步:Bayer 域是图像采集的原始数据形式,它是相机或其他图像采集设备获取图像的起点。这些数据会被后续的图像信号处理(ISP)单元进一步处理,以还原出完整的 RGB 图像。例如,在数码相机中,传感器输出的 Bayer 域数据会经过 ISP 的一系列算法,如去马赛克(demosaicing)、白平衡、色彩校正等处理,最终生成我们看到的彩色照片。
算法研究与优化:在图像和视频处理的研究领域,Bayer 域数据的处理是一个重要的研究方向。研究人员可以通过优化去马赛克算法来提高图像质量,或者研究如何直接在 Bayer 域进行一些简单而有效的图像处理操作,如边缘检测、噪声去除等,以减少后续处理的计算量和数据传输量。
从 Bayer 域到 RGB 图像的转换
去马赛克算法(Demosaicing):这是将 Bayer 域数据转换为 RGB 图像的关键步骤。去马赛克算法的目的是通过利用周围像素的颜色信息来估计每个像素缺失的颜色成分。例如,对于一个红色像素,算法会根据其周围的绿色和蓝色像素的位置和颜色值,通过插值等方法来计算出该像素位置应该具有的绿色和蓝色成分,从而得到完整的 RGB 值。常见的去马赛克算法包括双线性插值、双三次插值、自适应插值等,不同的算法在图像质量、计算复杂度等方面各有优劣。
后续色彩处理步骤:在完成去马赛克后,还需要进行其他色彩处理步骤,如白平衡调整、色彩校正、伽马校正等。白平衡调整可以纠正由于光源色温不同而导致的色彩偏差,色彩校正可以使图像的色彩更符合真实场景或预期的色彩风格,伽马校正则可以调整图像的亮度分布,使其更符合人眼的视觉特性。这些步骤共同作用,将从 Bayer 域转换而来的 RGB 图像进一步优化,以得到高质量的最终图像。
48.灰点特征(Gray Point Feature)
1.定义与概念
在图像处理和计算机视觉领域,灰点特征是指图像中具有特定灰度值的像素点所展现出来的特性。灰度值是表示图像黑白程度的一个数值,它是将彩色图像转换为黑白图像后每个像素点的亮度值。在常见的 8 位图像表示中,灰度值范围是 0 - 255,其中 0 代表黑色,255 代表白色。
灰点特征不仅仅是灰度值本身,还包括这些灰点在图像中的分布、形状、纹理等相关特征。例如,在一张 X 光胸片中,肺部区域的灰点特征可能表现为一定灰度范围内的大量灰点,这些灰点的分布呈现出肺部的轮廓形状,并且其纹理可以反映肺部组织的健康状况。
2.灰点特征的提取与表示
灰度直方图:这是一种常用的提取灰点特征的方法。灰度直方图是一个统计图表,它展示了图像中各个灰度级别的像素数量分布。通过分析灰度直方图,可以获取图像的整体灰度特征,如灰度的均值、方差、峰值等。例如,若一幅图像的灰度直方图在较暗的灰度区域有一个高峰,这可能意味着图像中有大面积的暗部区域;若直方图分布比较均匀,则说明图像的灰度变化比较丰富。
灰度共生矩阵(GLCM):GLCM 是用于描述图像中灰度级别的空间相关性的矩阵。它考虑了在一定方向(如水平、垂直、对角线等)和一定距离上的两个像素的灰度组合出现的频率。通过计算 GLCM 的各种统计量,如对比度、相关性、能量和熵等,可以提取灰点的纹理特征。例如,在一张卫星遥感图像中,利用 GLCM 可以区分不同地表类型的纹理,因为不同的植被、水体或建筑物区域具有不同的灰度共生关系。
局部二值模式(LBP):LBP 是一种基于局部纹理特征的描述方法。它通过比较中心像素与其周围像素的灰度值,将其转换为一个二进制编码。这个编码可以反映局部区域的纹理特征。例如,在人脸识别中,LBP 可以有效地提取面部皮肤的纹理特征,用于识别不同的人脸。
3.灰点特征的应用场景
图像分类与识别:在医学影像诊断中,不同疾病的影像可能具有不同的灰点特征。例如,在脑部 CT 图像中,肿瘤区域的灰点特征可能与正常脑组织不同。通过提取和分析这些灰点特征,可以帮助医生进行疾病的早期诊断和分类。在工业产品检测中,利用产品图像的灰点特征可以识别产品表面的缺陷,如划痕、裂纹等。
目标跟踪与定位:在视频监控中,通过跟踪目标物体的灰点特征变化,可以实现目标的定位和轨迹跟踪。例如,在交通监控中,利用车辆的灰点特征可以在复杂的交通场景中识别和跟踪车辆,为交通流量统计、违章行为监测等提供数据支持。
图像增强与复原:根据灰点特征可以对图像进行有针对性的增强。例如,对于曝光不足的图像,可以通过分析灰点特征找到暗部区域,然后采用合适的算法(如直方图均衡化)来增强这些区域的亮度,提高图像的整体质量。在图像复原领域,利用已知的灰点特征可以恢复被噪声污染或模糊的图像。
49.去噪DNS(Denoise)
50.黑电平校正BLC(Black Level Correction)
51.坏点校正DPC(Defective Pixel Correction)
52.LSC(lens Shading Correction)镜头阴影校正
53.RAW域
54.RGB域
55.YUV域
YUV是编译true-color颜色空间(color space)的种类,Y'UV, YUV, YCbCr,YPbPr等专有名词都可以称为YUV,彼此有重叠。“Y”表示明亮度(Luminance、Luma),“U”和“V”则是色度、浓度(Chrominance、Chroma),
为节省带宽起见,大多数YUV格式平均使用的每像素位数都少于24位。主要的抽样(subsample)格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和YCbCr 4:4:4。YUV的表示法称为A:B:C表示法:
- 4:4:4表示完全取样。
- 4:2:2表示2:1的水平取样,垂直完全采样。
- 4:2:0表示2:1的水平取样,垂直2:1采样。
- 4:1:1表示4:1的水平取样,垂直完全采样。
最常用Y:UV记录的比重通常1:1或2:1,DVD-Video是以YUV 4:2:0的方式记录,也就是我们俗称的I420,YUV4:2:0并不是说只有U(即Cb), V(即Cr)一定为0,而是指U:V互相援引,时见时隐,也就是说对于每一个行,只有U或者V分量,如果一行是4:2:0的话,下一行就是4:0:2,再下一行是4:2:0...以此类推。至于其他常见的YUV格式有YUY2、YUYV、YVYU、UYVY、AYUV、Y41P、Y411、Y211、IF09、IYUV、YV12、YVU9、YUV411、YUV420等。、