數(shù)字圖像處理:邊緣檢測
序言
在之前的文章中,我介紹了傅里葉變換,這次我將介紹另一種圖像處理方法,邊緣檢測。在openCV中,有很多函數(shù)可以讓我們找到圖像的邊緣,在這篇文章中,我將挑選出比較有代表性的Sobal算子和Laplacian算子進行介紹。
邊緣檢測
既然我們要檢測邊緣,首先我們需要了解邊緣是什么。
最簡單的邊緣
以上圖為例,我們可以看到黑白的分界線就是我們要找的邊緣,也就是像素之間的急劇變化。
拉普拉斯算子
原則拉普拉斯算子使用對圖像進行微分的方法來提取邊緣。具體推導(dǎo)方法如下。
以與正面相似的圖片為例,取其中一條橫線,加以區(qū)分。
可以看出,在邊緣的交界處,經(jīng)過微分后,會出現(xiàn)一個明顯的峰值。我們可以設(shè)置一個閾值,這樣如果微分后的圖像超過這個閾值,就會判斷為邊緣,進行后續(xù)處理。
但是這種方法不夠嚴(yán)謹(jǐn),所以也可以對圖像進行兩次微分。而二階導(dǎo)數(shù)結(jié)果中的Z點,也就是“過零”,就是我們要找的邊。
在了解了基本原理之后,我們需要從數(shù)學(xué)上推導(dǎo)出 Laplacian 所需的掩碼應(yīng)該是什么樣子。從上面的介紹可以看出,最重要的部分就是對圖像進行區(qū)分,但其實這在圖像中并不難,只要從下一個網(wǎng)格的像素中減去上一個網(wǎng)格的像素,即可以得到斜率,它是一階導(dǎo)數(shù)。
數(shù)學(xué)表達(dá)式
在知道如何推導(dǎo)一階微分之后,同樣可以推導(dǎo)出二階微分。在這里,我們將跳過推導(dǎo)過程,直接查看結(jié)果。
二階微分的數(shù)學(xué)公式
至此,我們得到了我們需要的拉普拉斯掩碼。
拉普拉斯算子掩碼
實施
我們可以使用 openCV 中提供的拉普拉斯運算函數(shù):
dst = cv2.Laplacian(src, ddepth, ksize)
src :要處理的圖像。
dst :輸出圖像。
ddepth :圖像的深度。有許多標(biāo)志可以使用。最常用的是cv2.CV_8U和cv2.CV_16S。
ksize :掩碼的大小。
import cv2
def main():
# read image
gray_img = cv2.imread("./lenna.jpg", 0)
cv2.imshow("img",gray_img)
# Try masks of different sizes
for n in range(1, 4):
# 使用拉普拉斯算子
kernel_size = 1+(n*2)
gray_lap = cv2.Laplacian(gray_img, cv2.CV_16S, ksizekernel_size)
# Convert image format to uint8
abs_lap = cv2.convertScaleAbs(gray_lap)
# display image
cv2.imshow(f"{1+n*2}_lap_img",abs_lap)
cv2.waitKey(0)
cv2.destroyAllWindows()
# save image
cv2.imwrite(f"./result/Laplacian/Laplacian_{1+n*2}.png",abs_lap)
if __name__ == "__main__":
main()
結(jié)果
Sobal 算子
原則
下圖是 Sobal 算子使用的掩碼。左邊是水平方向的邊緣檢測,右邊是垂直方向的邊緣檢測。
然后使用這個掩碼對圖像進行卷積得到邊緣圖像。
實施
就像拉普拉斯算子一樣,openCV 也提供了書面的 Sobal 函數(shù)。
dst = cv2.Sobel(src, ddepth, dx, dy, ksize)
src :要處理的圖像。
dst :輸出圖像。
ddepth :圖像的深度。有許多標(biāo)志可以使用。最常用的是cv2.CV_8U和cv2.CV_16S。
dx, dy :選擇要在水平或垂直方向進行的操作,選擇1, 0/0, 1。
ksize :掩碼的大小。
在Sobal操作之后,convertScaleAbs通常會執(zhí)行一個操作,將圖像轉(zhuǎn)換回可以正常顯示的格式。
dst = cv2.convertScaleAbs(src)
示例程序
import cv2
def main():
# read image
gray_img = cv2.imread("./lenna.jpg", 0)
cv2.imshow("img",gray_img)
# Try masks of different sizes
for n in range(1, 4):
# 使用 sobel 算子
kernel_size = 1+(n*2)
x = cv2.Sobel(gray_img, cv2.CV_16S, 1, 0, ksize=kernel_size)
y = cv2.Sobel(gray_img, cv2.CV_16S, 0, 1, ksize=kernel_size)
# Convert image format to uint8
absX = cv2.convertScaleAbs(x)
absY = cv2.convertScaleAbs(y)
# Add the results from both directions to form a complete contour
dst = cv2.a(chǎn)ddWeighted(absX, 0.5, absY,0.5,0)
# display image
cv2.imshow(f"{1+n*2}_x",absX)
cv2.imshow(f"{1+n*2}_y",absY)
cv2.imshow(f"{1+n*2}_x+y",dst)
cv2.waitKey(0)
cv2.destroyAllWindows()
# save image
cv2.imwrite(f"./result/Sobal/Sobal_{1+n*2}_x.png",absX)
cv2.imwrite(f"./result/Sobal/Sobal_{1+n*2}_y.png",absY)
cv2.imwrite(f"./result/Sobal/Sobal_{1+n*2}_x+y.png",dst)
if __name__ == "__main__":
main()
輸入
結(jié)果(內(nèi)核大小 = 3)
結(jié)果(內(nèi)核大小 = 5)
結(jié)果(內(nèi)核大小 = 7)
參考
原文標(biāo)題 : 數(shù)字圖像處理:邊緣檢測

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
-
10 每日AI全球觀察
- 1 特斯拉工人被故障機器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 AI 時代,阿里云想當(dāng)“安卓” ,那誰是“蘋果”?
- 4 硬剛英偉達(dá)!華為發(fā)布全球最強算力超節(jié)點和集群
- 5 拐點已至!匯川領(lǐng)跑工控、埃斯頓份額第一、新時達(dá)海爾賦能扭虧為盈
- 6 隱退4年后,張一鳴久違現(xiàn)身!互聯(lián)網(wǎng)大佬正集體殺回
- 7 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進軍好萊塢
- 8 谷歌“香蕉”爆火啟示:國產(chǎn)垂類AI的危機還是轉(zhuǎn)機?
- 9 機器人9月大事件|3家國產(chǎn)機器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!
- 10 美光:AI Capex瘋投不止,終于要拉起存儲超級周期了?
- 生產(chǎn)部總監(jiān) 廣東省/廣州市
- 資深管理人員 廣東省/江門市
- Regional Sales Manager 廣東省/深圳市
- 銷售總監(jiān) 廣東省/深圳市
- 結(jié)構(gòu)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 自動化高級工程師 廣東省/深圳市
- 技術(shù)專家 廣東省/江門市
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 封裝工程師 北京市/海淀區(qū)