OpenCV图像处理
我与nano 人气:0OpenCV图像处理
一、图像入门
1.读取图像
使用 cv.imread() 函数读取一张图像,图片应该在工作目录中,或者应该提供完整的图像路径。第二个参数是一个 flag,指定了应该读取图像的方式
cv.IMREAD_COLOR:加载彩色图像,任何图像的透明度都会被忽略,它是默认标志
cv.IMREAD_GRAYSCALE:以灰度模式加载图像
cv.IMREAD_UNCHANGED:加载图像,包括 alpha 通道
Note
你可以简单地分别传递整数 1、0 或-1,而不是这三个 flag。
import numpy as np import cv2 as cv # 用灰度模式加载图像 img = cv.imread('messi5.jpg', 0)
即使图像路径错误,它也不会抛出任何错误,但是打印 img会给你None
2.显示图像
用 cv.imshow() 函数在窗口中显示图像,窗口自动适应图像的大小。
第一个参数是窗口名,它是一个字符串,第二个参数就是我们的图像。你可以根据需要创建任意数量的窗口,但是窗口名字要不同。
cv.imshow('image', img) cv.waitKey(0) #毫秒级显示,如果是0就是按下任意按键结束显示 cv.destroyAllWindows()
cv.waitKey() 是一个键盘绑定函数,它的参数是以毫秒为单位的时间。该函数为任意键盘事件等待指定毫秒。如果你在这段时间内按下任意键,程序将继续。如果传的是 0,它会一直等待键盘按下。
cv.destroyAllWindows() 简单的销毁我们创建的所有窗口。如果你想销毁任意指定窗口,应该使用函数 cv.destroyWindow() 参数是确切的窗口名。
import numpy as np import cv2 as cv # 用RGB模式加载图像 img = cv.imread('1.jpg', 1) cv.imshow('image', img) cv.waitKey(0) cv.destroyAllWindows()
也可以同时显示两张图像
有一种特殊情况,你可以先创建一个窗口然后加载图像到该窗口。在这种情况下,你能指定窗口是否可调整大小。它是由这个函数完成的 cv.namedWindow()。默认情况下,flag 是 cv.WINDOW_AUTOSIZE。但如果你指定了 flag 为 cv.WINDOW_NORMAL,你能调整窗口大小。当图像尺寸太大,在窗口中添加跟踪条是很有用的。
import numpy as np import cv2 as cv # 用RGB模式加载图像 img = cv.imread('1.jpg', 1) cv.imshow('image', img) cv.waitKey(0) cv.destroyAllWindows()
可以看到图片可以拉伸,也可以自己去对比一下效果。
3.保存图像
保存图像,用这个函数 cv.imwrite()。
第一个参数是文件名,第二个参数是你要保存的图像。
import numpy as np import cv2 as cv # 用RGB模式加载图像 img = cv.imread('1.jpg', 1) cv.imwrite('11.jpg',img) #将1.jpg保存为11.jpg cv.namedWindow('image', cv.WINDOW_NORMAL) cv.imshow('image',img) cv.waitKey(0) cv.destroyAllWindows()
图像小结
下面的程序以灰度模式读取图像,显示图像,如果你按下 's‘ 会保存和退出图像,或者按下 ESC 退出不保存。
import numpy as np import cv2 as cv img = cv.imread('11.jpg',0) cv.imshow('image',img) k = cv.waitKey(0) if k == 27: # ESC 退出 cv.destroyAllWindows() elif k == ord('s'): # 's' 保存退出 cv.imwrite('m.jpg',img) cv.destroyAllWindows()
二、视频入门
1.用相机捕捉视频
通常,我们用相机捕捉直播。OpenCV 为此提供了一个非常简单的接口。我们用相机捕捉一个视频(我用的电脑内置摄像头),将它转换成灰度视频并显示。去获取一个视频,你需要创建一个VideoCapture对象。它的参数可以是设备索引或者一个视频文件名。设备索引仅仅是摄像机编号。通常会连接一台摄像机(as in my case)。所以我只传了 0(或者-1)。你可以通过传 1 来选择第二个摄像机,以此类推。之后,你能逐帧捕获。但是最后,不要忘记释放这个 Capture 对象。
import numpy as np import cv2 as cv cap = cv.VideoCapture(0) while(True): # 一帧一帧捕捉 ret, frame = cap.read() # 我们对帧的操作在这里 gray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY) # cv.COLOR_BGR2RG显示彩色图像 # 显示返回的每帧 cv.imshow('frame',gray) if cv.waitKey(1) & 0xFF == ord('q'): break # 当所有事完成,释放 VideoCapture 对象 cap.release() cv.destroyAllWindows()
cap.read() 返回一个 bool 值(True/False)。如果加载成功,它会返回True。因此,你可以通过这个返回值判断视频是否结束。
2.播放视频文件
它和从相机捕获一样,只需要用视频文件名更改相机索引。同时显示 frame,为 cv.waitKey() 使用合适的时间。如果它太小,视频将非常快,如果太大,视频将很慢 (嗯,这就是如何显示慢动作)。正常情况下,25 毫秒就可以了。
import numpy as np import cv2 as cv cap = cv.VideoCapture('FinalVideo_1642014289.728580.MP4') while(cap.isOpened()): ret, frame = cap.read() gray = cv.cvtColor(frame, cv.COLOR_BGR2RGB) cv.imshow('frame',gray) if cv.waitKey(1) & 0xFF == ord('q'): break cap.release() cv.destroyAllWindows()
视频只有30秒左右,可以看到视频播放速度很快,像是原视频2倍速播放一样。
3.保存视频
我们捕获视频,逐帧处理然后保存下来。对于图像来说,是非常的简单,就用 cv.imwrite()。这里需要做更多的工作。
这次我们创建一个 VideoWriter 对象。我们应该指定输出文件的名字 (例如:output.avi)。然后我们应该指定 FourCC 码。然后应该传递每秒帧数和帧大小。最后一个是 isColor flag。如果是 True,编码器期望彩色帧,否则它适用于灰度帧。
FourCC 是用于指定视频解码器的 4 字节代码。这里 fourcc.org 是可用编码的列表。它取决于平台,下面编码就很好。
In Fedora: DIVX, XVID, MJPG, X264, WMV1, WMV2. (XVID 是最合适的. MJPG 结果比较大. X264 结果比较小)
In Windows: DIVX (还需要测试和添加跟多内容)
In OSX: MJPG (.mp4), DIVX (.avi), X264 (.mkv).
对于 MJPG, FourCC 的代码作为 cv.VideoWriter_fourcc(‘M’,‘J’,‘P’,‘G’) 或 cv.VideoWriter_fourcc(‘MJPG’)* 传递。
import numpy as np import cv2 as cv cap = cv.VideoCapture(0) # 声明编码器和创建 VideoWrite 对象 fourcc = cv.VideoWriter_fourcc(*'XVID') out = cv.VideoWriter('output.avi',fourcc, 20.0, (640,480)) while(cap.isOpened()): ret, frame = cap.read() if ret==True: frame = cv.flip(frame,0) # 写入已经翻转好的帧 out.write(frame) cv.imshow('frame',frame) if cv.waitKey(1) & 0xFF == ord('q'): break else: break # 释放已经完成的工作 cap.release() out.release() cv.destroyAllWindows()
可以看到有avi文件生成。
总结
GUI功能是opencv的入门知识,还是很好理解的。
加载全部内容