openCV入门学习基础教程第二篇

时间:2022-11-22 老师我作业忘带了人气:0

1. HSV

由我们上一章所学，导入图片将其转化为灰度图并定义显示图片函数cv_show()。

import cv2 #opencv读取的格式是BGR
import numpy as np
import matplotlib.pyplot as plt#Matplotlib是RGB
%matplotlib inline 
 
def cv_show(name,img):
    cv2.imshow(name,img)
    cv2.waitKey(0)
    cv2.destroyAllWindows() 
 
img = cv2.imread('./data/gd01.jpg')
img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
# img_gray.shape 为 (300,400)

cv_show('win1',img_gray)

HSV：

H - 色调（主波长）。
S - 饱和度（纯度/颜色的阴影）。
V值（强度）

hsv = cv2.cvtColor(img,cv2.COLOR_BGR2RGB) # 转换成RGB
cv_show('win',hsv)

2. 图像阈值

上章所学我们得知，矩阵中unit8值(0-255)越大表示越亮，我们可以设定一个阈值thresh，比它大的做什么什么操作，比它小的做什么什么操作。

ret, dst = cv2.threshold(src, thresh, maxval, type) src：输入图，只能输入单通道图像，通常来说为灰度图

dst：输出图
thresh：阈值(0-255我们一般取127。)
maxval：当像素值超过了阈值（或者小于阈值，根据type来决定），所赋予的值。
type：二值化操作的类型，包含以下5种类型：
- cv2.THRESH_BINARY 超过阈值部分取maxval（最大值），否则取0。
- cv2.THRESH_BINARY_INV , THRESH_BINARY的反转。
- cv2.THRESH_TRUNC 大于阈值部分设为阈值，否则不变。
- cv2.THRESH_TOZERO 大于阈值部分不改变，否则设为0。
- cv2.THRESH_TOZERO_INV THRESH_TOZERO的反转。

ret, thresh1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)
ret, thresh2 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY_INV)
ret, thresh3 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TRUNC)
ret, thresh4 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO)
ret, thresh5 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO_INV)
# ps: ret为127 thresh1-5为图片矩阵
titles = ['Original Image', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']
images = [img, thresh1, thresh2, thresh3, thresh4, thresh5]
 
for i in range(6):
    plt.subplot(2, 3, i + 1), plt.imshow(images[i], 'gray')
    plt.title(titles[i])
    plt.xticks([]), plt.yticks([])
plt.show()

可以看到，与原始图片对比，(阈值127)情况下BINARY在亮的地方更亮了(变为255)，暗的地方更暗了(变为了0)。BINART_INV与其相反。后三种方法同理如上面所解释。

3. 图像平滑

对图像数据进行滤波操作。

在这之前我们先来学习一下如何给图片加入噪声，变成以下这种。

可以看到其实就是在这个矩阵随机位置的像素点变成了白色，255。

img = cv2.imread('./data/gd07.jpg')
 
#获取图片行、列、通道数
rows,cols,channels = img.shape
 
for i in range(0,5000):
    #根据在0和行-1之间获取随机整数
    x = np.random.randint(0,rows-1)
    #根据在0和列-1之间获取随机整数
    y = np.random.randint(0,cols-1)
 
    #将通道颜色改为255, (255,255,255)
    img[x,y][0] = 255
    img[x,y][1] = 255
    img[x,y][2] = 255
 
cv_show('win',img)

那么现在我们有了这种图像，该学习如何去掉噪音点了~

blur = cv2.blur(img, (3, 3))
- 均值滤波
box = cv2.boxFilter(img,-1,(3,3), normalize=True)
- 方框滤波
box = cv2.boxFilter(img,-1,(3,3), normalize=False)
- 方框滤波
aussian = cv2.GaussianBlur(img, (5, 5), 1)
- 高斯滤波
median = cv2.medianBlur(img, 5)
- 中值滤波

均值滤波--简单的平均卷积操作(卷积核大小3*3内部值都是1，下方参数是3*3矩阵均值)

blur = cv2.blur(img, (3, 3))
cv_show('win',blur)

方框滤波--基本和均值一样，可以选择归一化(-1表示颜色通道一致，3*3同上，normalize=True做归一化，此时与上方均值滤波是一样的。)

box = cv2.boxFilter(img,-1,(3,3), normalize=True)  
cv_show('win',box)

方框滤波--基本和均值一样，可以选择归一化,容易越界。(不再均值除以9，和大于255按255赋值。)

box = cv2.boxFilter(img,-1,(3,3), normalize=False)  
cv_show('win',box)

高斯滤波--高斯模糊的卷积核里的数值是满足高斯分布，相当于更重视中间的。(此时卷积核不再全是1，而是离的近的相对较大，离得远的相对较小。)

aussian = cv2.GaussianBlur(img, (5, 5), 1)  
cv_show('win',aussian)

中值滤波--相当于用中值代替(5*5的矩阵25个数，中间值为处理结果。)

median = cv2.medianBlur(img, 5)  # 中值滤波
cv_show('win',median)

均值、高斯、中值滤波对比：

res = np.hstack((blur,aussian,median))
#print (res)
cv_show('median vs average', res)

4. 形态学-腐蚀操作

所谓腐蚀操作，就是一点点侵蚀图片中的内容，如我刚刚挥笔写下的“帅”字，它长了很多“毛”，我们要把他侵蚀掉：

img = cv2.imread('./data/s.jpg', cv2.IMREAD_GRAYSCALE)
kernel = np.ones((3,3),np.uint8) 
erosion = cv2.erode(img,kernel,iterations = 1)
cv_show('win',erosion)

erosion = cv2.erode(img,kernel,iterations = 1)

kernel 卷积核
iterations 迭代次数

这不比之前更帅了(被腐蚀得线条也变瘦了)

关于卷积核选取和迭代次数：

上面选用3*3，以帅字为例，当3*3区域出现不同值(如这里0和255)，那么就把这个点腐蚀掉。

卷积核如果选择太大，可能会直接被侵蚀没掉。

pie = cv2.imread('./data/pie.png')
kernel = np.ones((30,30),np.uint8) 
erosion_1 = cv2.erode(pie,kernel,iterations = 1)
erosion_2 = cv2.erode(pie,kernel,iterations = 3)
erosion_3 = cv2.erode(pie,kernel,iterations = 5)
res = np.hstack((erosion_1,erosion_2,erosion_3))
cv_show('win',res)

5. 形态学-膨胀操作

我们上面不仅把“帅”边上长的“毛”去掉了，由于我们选择3*3卷积核，还顺便让它变瘦了，我们就以它变瘦之后的图片为例，再让它胖起来。

img = cv2.imread('./data/s.jpg',cv2.IMREAD_GRAYSCALE)
kernel = np.ones((3,3),np.uint8) 
shuai = cv2.erode(img,kernel,iterations = 1)
kernel = np.ones((3,3),np.uint8) 
shuai_PLUS = cv2.dilate(shuai,kernel,iterations = 1)
cv_show('win',shuai_PLUS )

shuai_PLUS = cv2.dilate(shuai,kernel,iterations = 1)

同理

pie = cv2.imread('./data/pie.png')
 
kernel = np.ones((30,30),np.uint8) 
dilate_1 = cv2.dilate(pie,kernel,iterations = 1)
dilate_2 = cv2.dilate(pie,kernel,iterations = 2)
dilate_3 = cv2.dilate(pie,kernel,iterations = 3)
res = np.hstack((dilate_1,dilate_2,dilate_3))
cv_show('win',res)

6. 开运算与闭运算

开：先腐蚀，再膨胀

img = cv2.imread('./data/s.jpg',cv2.IMREAD_GRAYSCALE)
 
kernel = np.ones((5,5),np.uint8) 
opening = cv2.morphologyEx(img, cv2.MORPH_OPEN, kernel)
 
cv_show('win',opening)

opening = cv2.morphologyEx(img, cv2.MORPH_OPEN, kernel)

闭：先膨胀，再腐蚀

img = cv2.imread('./data/s.jpg',cv2.IMREAD_GRAYSCALE)
 
kernel = np.ones((5,5),np.uint8) 
closing = cv2.morphologyEx(img, cv2.MORPH_CLOSE, kernel)
 
cv_show('win',closing)

closing = cv2.morphologyEx(img, cv2.MORPH_CLOSE, kernel)

7. 梯度运算

梯度=膨胀-腐蚀

pie = cv2.imread('./data/pie.png',cv2.IMREAD_GRAYSCALE)
kernel = np.ones((7,7),np.uint8) 
dilate = cv2.dilate(pie,kernel,iterations = 5)
erosion = cv2.erode(pie,kernel,iterations = 5)
 
res = np.hstack((dilate,erosion))
 
cv_show('win',res)

以下是经过5次腐蚀和5次膨胀后的图像：

获得边界信息：梯度运算

gradient = cv2.morphologyEx(pie, cv2.MORPH_GRADIENT, kernel)
 
cv_show('win',gradient)

gradient = cv2.morphologyEx(pie, cv2.MORPH_GRADIENT, kernel)

8. 礼帽与黑帽

礼帽 = 原始输入-开运算结果
黑帽 = 闭运算-原始输入

# 礼帽
img = cv2.imread('./data/s.jpg',cv2.IMREAD_GRAYSCALE)
tophat = cv2.morphologyEx(img, cv2.MORPH_TOPHAT, kernel)
cv_show('win',tophat)

（只剩下“毛”了）

# 黑帽
img = cv2.imread('./data/s.jpg',cv2.IMREAD_GRAYSCALE)
blackhat  = cv2.morphologyEx(img,cv2.MORPH_BLACKHAT, kernel)
cv_show('win',blackhat)

（只剩下小轮廓了）

9. 图像梯度-Sobel算子

我们依旧引入图像pie

img = cv2.imread('./data/pie.png',cv2.IMREAD_GRAYSCALE)
cv_show('win',img)

可见在边缘部分(黑白交界)，梯度比较大。

定义Gx，Gy处理水平和竖直方向上的梯度。

sobelx = cv2.Sobel(img,cv2.CV_64F,1,0,ksize=3)
 
cv_show('sobelx',sobelx)

dst = cv2.Sobel(src, ddepth, dx, dy, ksize)

- ddepth:图像的深度(一般-1)
- dx和dy分别表示水平和竖直方向
- ksize是Sobel算子的大小
- cv2.CV_64F处理差为负数情况。

为什么只有一半呢？

我们定义的矩阵计算时是右-左，白-黑>0正常显示，黑-白<0进行了截断为0，

白到黑是正数，黑到白就是负数了，所有的负数会被截断成0，所以要取绝对值。

我们需要对其进行一下转换：

sobelx = cv2.Sobel(img,cv2.CV_64F,1,0,ksize=3)
sobelx = cv2.convertScaleAbs(sobelx)
cv_show('sobelx',sobelx)

sobelx = cv2.convertScaleAbs(sobelx)

上面是水平方向，下面是竖直方向：

sobely = cv2.Sobel(img,cv2.CV_64F,0,1,ksize=3)
sobely = cv2.convertScaleAbs(sobely)  
cv_show('sobelx',sobely)

分别计算x和y，再求和:

sobelxy = cv2.addWeighted(sobelx,0.5,sobely,0.5,0)
cv_show('sobelxy',sobelxy)

但不建议都是设置成1，效果可能不好。

sobelxy=cv2.Sobel(img,cv2.CV_64F,1,1,ksize=3)
sobelxy = cv2.convertScaleAbs(sobelxy) 
cv_show('sobelxy',sobelxy)

建议：分别算Gx，Gy自己进行求和操作：

img = cv2.imread('./data/gd01.jpg',cv2.IMREAD_GRAYSCALE)
sobelx = cv2.Sobel(img,cv2.CV_64F,1,0,ksize=3)
sobelx = cv2.convertScaleAbs(sobelx)
sobely = cv2.Sobel(img,cv2.CV_64F,0,1,ksize=3)
sobely = cv2.convertScaleAbs(sobely)
sobelxy = cv2.addWeighted(sobelx,0.5,sobely,0.5,0)
 
sobelxy2=cv2.Sobel(img,cv2.CV_64F,1,1,ksize=3)
sobelxy2 = cv2.convertScaleAbs(sobelxy2)
res = np.hstack((sobelxy,sobelxy2))
cv_show('res',res)

10. 图像梯度-Scharr算子和laplacian算子

Scharr算子

laplacian算子

核中数值有差异，Scharr敏感些。

laplacian算子涉及二阶导，更加敏感同时对噪声也更加敏感，一般和其他方法配合使用。

原理同上，我们来对比一下这三种算子效果：

img = cv2.imread('./data/gd01.jpg',cv2.IMREAD_GRAYSCALE)
sobelx = cv2.Sobel(img,cv2.CV_64F,1,0,ksize=3)
sobely = cv2.Sobel(img,cv2.CV_64F,0,1,ksize=3)
sobelx = cv2.convertScaleAbs(sobelx)   
sobely = cv2.convertScaleAbs(sobely)  
sobelxy =  cv2.addWeighted(sobelx,0.5,sobely,0.5,0)  
 
scharrx = cv2.Scharr(img,cv2.CV_64F,1,0)
scharry = cv2.Scharr(img,cv2.CV_64F,0,1)
scharrx = cv2.convertScaleAbs(scharrx)   
scharry = cv2.convertScaleAbs(scharry)  
scharrxy =  cv2.addWeighted(scharrx,0.5,scharry,0.5,0) 
 
laplacian = cv2.Laplacian(img,cv2.CV_64F)
laplacian = cv2.convertScaleAbs(laplacian)   
 
res = np.hstack((sobelxy,scharrxy,laplacian))
cv_show('res',res)

scharrx = cv2.Scharr(img,cv2.CV_64F,1,0)

laplacian = cv2.Laplacian(img,cv2.CV_64F)

10. 知识点总结*

图像阈值：

ret, thresh1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)
ret, thresh2 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY_INV)
ret, thresh3 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TRUNC)
ret, thresh4 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO)
ret, thresh5 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO_INV)
# ps: ret为127 thresh1-5为图片矩阵
titles = ['Original Image', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']
images = [img, thresh1, thresh2, thresh3, thresh4, thresh5]
 
for i in range(6):
    plt.subplot(2, 3, i + 1), plt.imshow(images[i], 'gray')
    plt.title(titles[i])
    plt.xticks([]), plt.yticks([])
plt.show()

图像平滑

# 加入噪声
img = cv2.imread('./data/gd07.jpg')
 
#获取图片行、列、通道数
rows,cols,channels = img.shape
 
for i in range(0,5000):
    #根据在0和行-1之间获取随机整数
    x = np.random.randint(0,rows-1)
    #根据在0和列-1之间获取随机整数
    y = np.random.randint(0,cols-1)
 
    #将通道颜色改为255, (255,255,255)
    img[x,y][0] = 255
    img[x,y][1] = 255
    img[x,y][2] = 255
 
cv_show('win',img)

blur = cv2.blur(img, (3, 3))
box = cv2.boxFilter(img,-1,(3,3), normalize=True)  
aussian = cv2.GaussianBlur(img, (5, 5), 1)  
median = cv2.medianBlur(img, 5) 
 
res = np.hstack((blur,aussian,median))
cv_show('median vs average', res)

形态学-腐蚀

img = cv2.imread('./data/s.jpg', cv2.IMREAD_GRAYSCALE)
kernel = np.ones((3,3),np.uint8) 
erosion = cv2.erode(img,kernel,iterations = 1)
cv_show('win',erosion)

形态学-膨胀

img = cv2.imread('./data/s.jpg',cv2.IMREAD_GRAYSCALE)
kernel = np.ones((3,3),np.uint8) 
shuai = cv2.erode(img,kernel,iterations = 1)
kernel = np.ones((3,3),np.uint8) 
shuai_PLUS = cv2.dilate(shuai,kernel,iterations = 1)
cv_show('win',shuai_PLUS )

开运算与闭运算

img = cv2.imread('./data/s.jpg',cv2.IMREAD_GRAYSCALE)
 
kernel = np.ones((5,5),np.uint8) 
opening = cv2.morphologyEx(img, cv2.MORPH_OPEN, kernel)
 
cv_show('win',opening)

梯度运算

gradient = cv2.morphologyEx(pie, cv2.MORPH_GRADIENT, kernel)
 
cv_show('win',gradient)

礼帽与黑帽

# 礼帽
img = cv2.imread('./data/s.jpg',cv2.IMREAD_GRAYSCALE)
tophat = cv2.morphologyEx(img, cv2.MORPH_TOPHAT, kernel)
cv_show('win',tophat)
 
 
# 黑帽
img = cv2.imread('./data/s.jpg',cv2.IMREAD_GRAYSCALE)
blackhat  = cv2.morphologyEx(img,cv2.MORPH_BLACKHAT, kernel)
cv_show('win',blackhat)

Sobel、Scharr、Laplacian算子

img = cv2.imread('./data/gd01.jpg',cv2.IMREAD_GRAYSCALE)
sobelx = cv2.Sobel(img,cv2.CV_64F,1,0,ksize=3)
sobely = cv2.Sobel(img,cv2.CV_64F,0,1,ksize=3)
sobelx = cv2.convertScaleAbs(sobelx)   
sobely = cv2.convertScaleAbs(sobely)  
sobelxy =  cv2.addWeighted(sobelx,0.5,sobely,0.5,0)  
 
scharrx = cv2.Scharr(img,cv2.CV_64F,1,0)
scharry = cv2.Scharr(img,cv2.CV_64F,0,1)
scharrx = cv2.convertScaleAbs(scharrx)   
scharry = cv2.convertScaleAbs(scharry)  
scharrxy =  cv2.addWeighted(scharrx,0.5,scharry,0.5,0) 
 
laplacian = cv2.Laplacian(img,cv2.CV_64F)
laplacian = cv2.convertScaleAbs(laplacian)   
 
res = np.hstack((sobelxy,scharrxy,laplacian))
cv_show('res',res)

总结

加载全部内容