目录
此章节主要讲解:直方图定义、均衡化、傅里叶变换
一.直方图
统计的直方图主要根据图像的像素点的值, 从0~255的值依次统计出现的次数形成的直方图。
统计直方图的语法格式如下:
cv2.calcHist(images,channels,mask,histSize,ranges)
- images: 原图像图像格式为 uint8 或 foat32。当传入函数时应 用中括号‖括来例如[img]
- channels;:同样用中括号括来它会告函数我们统幅图 像的直方图。如果入图像是灰度图它的值就是[0]如果是彩色图像 的传入的参数可以是[0][1][2]它们分别对应着 BGR。
- mask: 掩模图像。统整幅图像的直方图就把它为 None。但是如 果你想统图像某一分的直方图的你就制作一个掩模图像并使用它。
- histSize:BIN 的数目。也应用中括号括来
- ranges:像素值范围常为[0256]
代码演示如下:
import cv2
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
matplotlib.use('TkAgg')
img = cv2.imread('2.jpg')
hist = cv2.calcHist([img],[0],None,[256],[0,256])
print(hist.shape)
plt.hist(img.ravel(),256)
plt.show()
统计三原色直方图代码如下:
import cv2
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
matplotlib.use('TkAgg')
img = cv2.imread('4.jpg')
colors = ('b','g','r')
for i,col in enumerate(colors):
hist = cv2.calcHist([img],[i],None,[256],[0,256])
plt.plot(hist,color = col)
plt.xlim([0,256])
plt.show()
mask的操作代码如下:
import cv2
import numpy as np
img = cv2.imread('10.png')
mask = np.zeros(img.shape[:2],np.uint8)
print(mask.shape)
mask[100:300,100:400] = 255
cv2.imshow('mask',mask)
cv2.waitKey(0)
cv2.destroyAllWindows()
注:
选取截取的区域保存的区域要置为255
综合代码如下:
import cv2
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
matplotlib.use('TkAgg')
img = cv2.imread('11.png',0)
mask = np.zeros(img.shape[:2],np.uint8)
mask[100:300,100:400] = 255
# mask与运算,显示部分图像
# bitwise_and函数,第一个参数是图像,第二个参数是图像,第三个参数是掩模
mask_img = cv2.bitwise_and(img,img,mask = mask)
# 直方图
hist_full = cv2.calcHist([img],[0],None,[256],[0,256])
# 掩模
hist_mask = cv2.calcHist([img],[0],mask,[256],[0,256])
# 绘制原图
plt.subplot(221),plt.imshow(img,'gray')
# 绘制掩模
plt.subplot(222),plt.imshow(mask,'gray')
# 绘制掩模图像
plt.subplot(223),plt.imshow(mask_img,'gray')
# 绘制直方图
plt.subplot(224),plt.plot(hist_full),plt.plot(hist_mask)
plt.xlim([0,256])
plt.show()
cv2.waitKey(0)
cv2.destroyAllWindows()
二.直方图均衡化操作
注:
首先“灰度值”代表是上面原始图像的像素点的值,“像素个数”则代表统计图像出现灰度值的出现次数,“概率”则代表的是计算出来的频率,第一个的“累积概率”就是概率值,从第二个开始起的“累积概率”则是前一个概率加上后一个概率直到加到当前概率值为止。如图:0.25+0.1875=0.4375放入到累积概率中。
“根据函数映射后的灰度值”则代表的是“(累积概率)*(设立的取值范围)”。最后因为灰度值不能有小数进行最后“取整”部分。
代码演示如下:
import cv2
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
matplotlib.use('TkAgg')
img = cv2.imread('15.png',0)
equ = cv2.equalizeHist(img)
plt.hist(img.ravel(),256)
plt.show()
plt.hist(equ.ravel(),256)
plt.show()
res2 = np.hstack((img,equ))
cv2.imshow('res2',res2)
cv2.waitKey(0)
cv2.destroyAllWindows()
均衡化前的直方图:
均衡化后的直方图如下:
均衡化前后的对比图像如下:
注:第一个是均衡化前的图像,第二个图像是均衡化后的图像
由于现在直方图是全局均衡并不是很靠谱在处理图像的时候往往会有噪声等因素影响,若想要使图像均衡化更加靠谱,OpenCV自带提供了一个名叫自适应直方图均衡化,它是局部进行一块一块处理图像。这样可以避免图像受一些因素的干扰。
自适应直方图均衡化操作格式如下:
cv2.createCLAHE(clipLimit,tileGridSize)
createCLAHE的第一个参数clipLimit是阈值,第二个参数tileGridSize是像素块的大小。
代码演示如下:
import cv2
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
matplotlib.use('TkAgg')
img = cv2.imread('3.jpg',0)
# createCLAHE的第一个参数clipLimit是阈值,第二个参数tileGridSize是像素块的大小
clahe = cv2.createCLAHE(clipLimit=2.0,tileGridSize=(8,8))
equ = cv2.equalizeHist(img)
res_clahe = clahe.apply(img)
res = np.hstack((img,equ,res_clahe))
cv2.imshow('res',res)
cv2.waitKey(0)
cv2.destroyAllWindows()
图像呈现如下:
第一个图像是原图,第二个是全局均衡化的图像,第三个是局部均衡化图像。
三.傅里叶变换
我们生活在时间的世界中,早上7:00起来吃早饭,8:00去挤地铁,9:00开始上班。。。以时间为参照就是时域分析但是在频域中一切都是静止的!
以下链接主要讲解傅里叶变换的详细,若想了解可以点击去查看。
https://zhuanlan.zhihu.com/p/19763358
傅里叶变换的作用,如下:
- 高频:变化剧烈的灰度分量,例如边界
- 低频:变化缓慢的灰度分量,例如一片大海
滤波,如下:
- 低通滤波器:只保留低频,会使得图像模糊
- 高通滤波器:只保留高频,会使得图像细节增强
傅里叶变换操作前必准备如下:
- opencv中主要就是cv2.dft()和cv2.idft(),输入图像需要先转换成np.float32 格式。
- 得到的结果中频率为0的部分会在左上角,通常要转换到中心位置,可以通过shift变换来实现。
- cv2.dft()返回的结果是双通道的(实部,虚部),通常还需要转换成图像格式才能展示(0,255)。
代码演示如下:
import cv2
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
matplotlib.use('TkAgg')
img = cv2.imread('15.png',0)
# float32的作用是将图片转换为浮点数类型
img_float32 = np.float32(img)
# dft的作用是快速傅里叶变换
# dft的第一个参数是输入的图片,第二个参数flags是控制变换的参数,第三个参数是变换的尺寸,第四个参数是变换的步长,第五个参数是变换的锚点,第六个参数是变换的缩放因子,第七个参数是变换的平移量,第八个参数是变换的旋转角度,第九个参数是变换的旋转中心,第十个参数是变换的旋转轴,第十一个参数是变换的旋转轴的旋转角度,第十二个参数是变换的旋转轴的旋转中心,第十三个参数是变换的旋转轴的旋转缩放因子,第十四个参数是变换的旋转轴的旋转平移量,
# dft返回值是变换后的图片
dft = cv2.dft(img_float32,flags = cv2.DFT_COMPLEX_OUTPUT)
# fftshift的作用是将图片的 Fourier 频谱从 DC 频段移动到中心位置
# fftshift的第一个参数是输入的图片
dft_shift = np.fft.fftshift(dft)
# magnitude_spectrum的作用是计算图片的幅度谱
# magnitude_spectrum的第一个参数是输入的图片,第二个参数是计算幅度谱的参数
magnitude_spectrum = 20*np.log(cv2.magnitude(dft_shift[:,:,0],dft_shift[:,:,1]))
plt.subplot(121),plt.imshow(img, cmap = 'gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(122),plt.imshow(magnitude_spectrum, cmap = 'gray')
plt.title('Magnitude Spectrum'), plt.xticks([]), plt.yticks([])
plt.show()
注:
cv2.dft()的作用是快速傅里叶变换
dft的第一个参数是输入的图片,第二个参数flags是控制变换的参数,第三个参数是变换的尺寸,第四个参数是变换的步长,第五个参数是变换的锚点,第六个参数是变换的缩放因子,第七个参数是变换的平移量,第八个参数是变换的旋转角度,第九个参数是变换的旋转中心,第十个参数是变换的旋转轴,第十一个参数是变换的旋转轴的旋转角度,第十二个参数是变换的旋转轴的旋转中心,第十三个参数是变换的旋转轴的旋转缩放因子,第十四个参数是变换的旋转轴的旋转平移量,
dft返回值是变换后的图片
numpy.float32的作用是将图片转换为浮点数类型
fftshift的作用是将图片的 Fourier 频谱从 DC 频段移动到中心位置
fftshift的第一个参数是输入的图片
magnitude_spectrum的作用是计算图片的幅度谱
magnitude_spectrum的第一个参数是输入的图片,第二个参数是计算幅度谱的参数
低通滤波器,傅里叶变换代码演示如下:
import cv2
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
matplotlib.use('TkAgg')
img = cv2.imread('15.png',0)
# float32的作用是将图片转换为浮点数类型
img_float32 = np.float32(img)
# dft的作用是快速傅里叶变换
# dft的第一个参数是输入的图片,第二个参数flags是控制变换的参数,第三个参数是变换的尺寸,第四个参数是变换的步长,第五个参数是变换的锚点,第六个参数是变换的缩放因子,第七个参数是变换的平移量,第八个参数是变换的旋转角度,第九个参数是变换的旋转中心,第十个参数是变换的旋转轴,第十一个参数是变换的旋转轴的旋转角度,第十二个参数是变换的旋转轴的旋转中心,第十三个参数是变换的旋转轴的旋转缩放因子,第十四个参数是变换的旋转轴的旋转平移量,
# dft返回值是变换后的图片
dft = cv2.dft(img_float32,flags = cv2.DFT_COMPLEX_OUTPUT)
# fftshift的作用是将图片的 Fourier 频谱从 DC 频段移动到中心位置
# fftshift的第一个参数是输入的图片
dft_shift = np.fft.fftshift(dft)
rows,cols=img.shape
crow,ccol = int(rows/2) , int(cols/2) # 中心位置
# 低通滤波
mask = np.zeros((rows,cols,2),np.uint8)
mask[crow-30:crow+30, ccol-30:ccol+30] = 1
# IDFT
fshift = dft_shift*mask
f_ishift = np.fft.ifftshift(fshift)
img_back = cv2.idft(f_ishift)
img_back = cv2.magnitude(img_back[:,:,0],img_back[:,:,1])
plt.subplot(121),plt.imshow(img, cmap = 'gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(122),plt.imshow(img_back, cmap = 'gray')
plt.title('Result'), plt.xticks([]), plt.yticks([])
plt.show()
注:
从此图可以看出来低通滤波器是“只保留低频,会使得图像模糊”。
高通滤波器傅里叶变换代码演示如下:
import cv2
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
matplotlib.use('TkAgg')
img = cv2.imread('15.png',0)
# float32的作用是将图片转换为浮点数类型
img_float32 = np.float32(img)
# dft的作用是快速傅里叶变换
# dft的第一个参数是输入的图片,第二个参数flags是控制变换的参数,第三个参数是变换的尺寸,第四个参数是变换的步长,第五个参数是变换的锚点,第六个参数是变换的缩放因子,第七个参数是变换的平移量,第八个参数是变换的旋转角度,第九个参数是变换的旋转中心,第十个参数是变换的旋转轴,第十一个参数是变换的旋转轴的旋转角度,第十二个参数是变换的旋转轴的旋转中心,第十三个参数是变换的旋转轴的旋转缩放因子,第十四个参数是变换的旋转轴的旋转平移量,
# dft返回值是变换后的图片
dft = cv2.dft(img_float32,flags = cv2.DFT_COMPLEX_OUTPUT)
# fftshift的作用是将图片的 Fourier 频谱从 DC 频段移动到中心位置
# fftshift的第一个参数是输入的图片
dft_shift = np.fft.fftshift(dft)
rows,cols=img.shape
crow,ccol = int(rows/2) , int(cols/2) # 中心位置
# 高通滤波
mask = np.ones((rows,cols,2),np.uint8)
mask[crow-30:crow+30, ccol-30:ccol+30] = 0
# IDFT
fshift = dft_shift*mask
f_ishift = np.fft.ifftshift(fshift)
img_back = cv2.idft(f_ishift)
img_back = cv2.magnitude(img_back[:,:,0],img_back[:,:,1])
plt.subplot(121),plt.imshow(img, cmap = 'gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(122),plt.imshow(img_back, cmap = 'gray')
plt.title('Result'), plt.xticks([]), plt.yticks([])
plt.show()
注:
从此图可以看出来,高通滤波器是“只保留高频,会使得图像细节增强”,变化剧烈的灰度分量,例如边界。