python opencv图像金字塔轮廓及模板匹配 python计算机视觉opencv图像金字塔轮廓及模板匹配
Swayzzu 人气:01.图像金字塔
①高斯金字塔
向下采样,数据会越来越少,减少的方式是:将偶数行和列删除
向上采样,数据会越来越多,将图像在每个方向上扩大为原来的两倍,新增的行和列用0来填充。使用先前同样的内核与放大后的图像卷积,获得近似值。
上采样之后,图片会变大。
下采样后,图片会变小。
②拉普拉斯金字塔
对于原始图像,先执行下采样,再执行上采样,并用原始图像减去得到的采样结果。
以上的计算方式为1层,第二层的计算,把第一层得到的结果作为原始图像进行计算。
2.图像轮廓
cv.findContours(img,mode,method)
最常用的mode:
RETR_TREE,检测所有的轮廓,并重构嵌套轮廓的整个层次
最常用的method:
CHAIN_APPROX_NONE:以Freeman链码的方式输出轮廓,所有其他方法输出多边形(顶点的序列)
CHAIN_APPROX_SIMPLE:压缩水平的、垂直的和斜的部分,也就是函数只保留他们的终点部分。
①寻找轮廓
函数返回的第一个参数contours就是我们所需要的轮廓信息。它是一个列表的形式。每一个元素都是数组形式。一个图像中可能有多个轮廓,并且会有外轮廓以及内轮廓,均可通过返回的contours调用。
②轮廓特征
通过调用不同的函数可以求得轮廓的面积以及周长等。
③轮廓绘制
第一个参数就是要画上去的图,第二个是轮廓信息,第三个是轮廓的索引,第四个是使用的颜色通道,第五个是线条的宽度。
也可以画出轮廓的边界矩形或者外接圆:
3.模板匹配
模板匹配 模板在原图像上,从原点开始滑动,计算模板与图像被模板覆盖的地方的差别程度,这个差别程度在opencv里有6种,然后将每次计算的结果放在一个矩阵里,作为结果输出。假如原图像是AB,模板是ab大小,则输出结果是(A-a+1) * (B-b+1)
TM_SQDIFF:平方差异,越小越相关
TM_CCORR:相关性,越大越相关
TM_CCOEFF:相关系数,越大越相关
TM_SQDIFF_NORMED:归一化平方不同,越接近0越相关
TM_CCORR_NORMED:归一化相关性,越接近1越相关
TM_CCOEFF_NORMED:归一化相关系数,越接近1越相关
建议:尽量使用归一化的方法
①模板匹配
读取图片以及需要匹配的模板,并将其进行灰度化处理:
下面得到的h,w就是模板的长和宽
通过matchTemplate的方法进行匹配:
②匹配框线绘制
对于匹配所得的返回值,通过minMaxLoc得到最小值和最大值,以及各自对应的坐标。根据选择的方法不同,所需要的目标值不同。比如TM_SQDIFF_NORMED:归一化平方不同,就是越接近0越相关,即越小越好。
得到了最佳的值以及坐标,就可以画出来矩形框。
在rectangle方法中,参数依次是:要画框的图片,框的左上角坐标,框的右下角坐标,框的亮度,框的线条粗细。结果如下:
③多对象匹配
模板匹配也可匹配多个对象,若图片中有多个和模板匹配的内容,cv.matchTemplate返回的内容中会有多个分数高的结果,设定阈值后,把分数高的结果的坐标,按同样的方式处理,把方框全部画出来即可。
4.直方图统计
①直方图绘制
可直接通过plt.hist方法,将图像矩阵扁平化之后,绘制不同的像素出现的频率直方图。
②直方图统计
cv2.calcHist(images,channels,mask,histSize,ranges)
参数中:
imges
:传入的图像
channels
:颜色通道,如果是灰度图就是[0],如果是彩色可以是[0],[1],[2]。分别对应着BGR。
mask
:掩膜,如果需要对图像进行掩膜处理可以传入此参数。
histSize
:就是bin的数目,可以直接填入[256]
ranges
:像素值范围,常为:[0,256]
注意:传入参数时,都需要用中括号括起来。
calcHist返回值是对应颜色的统计值。当i是0的时候,就是B,1对应G,2对应R
③直方图的mask操作
创建mask,此处使用图片的长宽作为mask的长宽,并把需要展示的地方置为1,其他地方置为0即可。
通过bitwise_and,即“与”操作,即可实现掩膜操作。
把Mask应用到图片中,并画出直方图:
④直方图均衡化
通过cv.equalizeHist方法,可以对直方图进行均衡化
直方图前后对比如下:
对应的图像发生的变化如下:
以上的方式是对全局直接进行均衡化。可以看出图中雕像的脸变得模糊。通过自适应直方图均衡化可解决此问题,自适应均衡化是通过将图片分成不同的小块,对每一小块进行各自的均衡化。
5.傅里叶变换
低通滤波是保留低频,图像会变得模糊。高通滤波是保留高频,图像的细节会增强。
在opencv中主要是cv2.dft()和cv2.idft(),输入图像需要先转换成np.float32的格式 得到的结果中,频率为0的部分会在左上角,通常要转换到中心位置,可以通过shift变换来实现 cv2.dft()得到的结果是双通道的(实部、虚部),通常还需要转换成图像格式才能展示(0,255)
上图是将图片转换到频域之后,转换成灰度图并且展示的形式。
在低通滤波中,当转换到频域并把低频的放到中间后,只需要设置一个掩膜,即可把图像高频滤除掉。然后在通过逆转换,还原图像即可。具体代码如下:
在高通滤波器中,只需要把上面的代码中的掩膜转换一下,把0换成1,1换成0即可实现高通滤波。最终的图片展示如下:
可以看出,图片只保留了高频,也就是变化剧烈的部分,也就是图像中的边缘。
加载全部内容