一文詳解計算機視覺與深度學習的應用
全球汽車快訊 據外媒報道,當人們看風景或看圖像時,他(她)們能夠理解看到的內容——風景或照片內的目標。
若該行為正在進行中,那么會發(fā)生什么呢?而一臺計算機則僅能處理用于描述各像素顏色值的數字數據。
對于某個人而言,從凌亂的桌面上識別出一塊披薩,可謂毫不費力。但直到如今,計算機卻無法執(zhí)行這類任務。
計算機視覺(簡稱:CV)可幫助一臺計算機從視覺輸入中選出重要的信息,然后基于該信息進行精準的預測并提出建議。
計算機視覺的工作原理是?
在計算機視覺誕生之前,為創(chuàng)建一個程序來識別特殊的圖像,某人需要耗費數小時的時間,來手動完成這類繁瑣的工作。
首先,需要核對一個相似圖像的數據庫。然后,不得不人工分析、測量這類圖像,當研究人員或許能識別存疑的目標時,標注相關的數據(如:顏色、測量值及形狀)。當時,或許只有軟件能被用于預測工作。
而計算機視覺則采用深度學習這類機器學習方法,自動完成上述的所有流程。
深度學習采用了多層神經元網絡,其含有數百個潛在的層級。若遇到圖像,則通常采用一個卷積神經元網絡(convolutional neural network,CNN)。
詳細解釋深度學習和神經元網絡的工作原理已遠超本文的內容范疇。從本質上講,就是向神經元網絡送入大量的數據。然后,神經元網絡會反復分析數據,直到能做出精準的預測為止。
以用于某個計算機視覺的卷積神經元網絡為例,神經元網絡將通過多個步驟來取得數據。首先,神經元網絡將圖像拆解為多個部分(單個像素或預先標注過的像素組)。
然后,對不同部分的圖像(如:硬邊緣或特定目標)進行預測。神經元網絡還會反復檢查其預測結果的準確性,每次都會對算法進行微調,直至其變得極為精準。
如今,計算機的功能變得極為強大,相較于人腦,前者對圖像的分析速度更快。當其學會識別特定模式后,情況就更是如此了。為此,深度學習算法或將遠超人類的能力,這一點不難看出。
計算機視覺的類型有哪些呢?
計算機視覺涉及對圖像的分析與理解、對圖像相關預測或決策的輸出。為實現這類目標,計算機視覺有各類不同的任務,如下:
圖像分類:識別圖像的類型。例如,分辨是人臉、景色還是目標。這類任務常被用于迅速識別圖像并予以分類。該技術的一項用途是自動識別并屏蔽社交媒體上的“不健康”內容。
目標識別:類似于圖像分類,目標識別可識別某個場景內的特定目標——如:從凌亂的桌面上識別出一塊披薩。
邊緣檢測:計算機視覺技術的常見用法,通常是目標檢測的第一步,該技術可識別圖像內的硬邊緣。
目標標識:這指的是對某個目標物或圖像中的個別例子進行識別,例如:標注某個特定的人、指紋或車輛。
目標檢測:目標檢測指的是識別某張圖片內的特定特征進行標識,例如:X光片中的骨折。
目標分割:指的是識別圖像中的哪個像素屬于存疑的目標。
目標追蹤:在一段視頻序列中,在識別某個目標后,可輕松在整段視頻中追溯到該目標。
圖像復原:在精準標識圖像中的目標物與背景后,可移除圖像中的模糊、噪點及其他圖像偽影。
計算機視覺的應用示例
人工智能技術已被用于多個行業(yè),并產生了驚人的影響。計算機視覺技術也同樣如此。以下是計算機視覺在當下的幾個應用示例。
面部識別
面部識別是當今計算機視覺的主要應用方式之一。當對已知面部圖像數據庫進行照片比對時,計算機視覺算法可精準地識別個人。
社交媒體分析圖像并自動為經過一輪圖像篩選后的用戶貼標
筆記本電腦、電話和安全設備可對人們的身份加以識別,并給予合規(guī)人員使用權限。
執(zhí)法人員在閉路電池系統內使用面部識別來確定嫌疑人的身份。
醫(yī)藥
目前,計算機視覺被用于醫(yī)療保健行業(yè),旨在為患者提供更快捷、更精準的診斷,其診斷結果甚至遠勝于醫(yī)學專家。
該技術的諸多應用還涉及:對X光、計算機斷層掃描或核磁共振影像進行分析并用于篩查神經系統病癥、腫瘤、骨裂或骨折等特定疾病。
自動駕駛汽車
自動駕駛汽車需要對車輛周邊環(huán)境進行了解,以便確保駕駛安全性。這意味著需要識別道路、車道、交通信號燈、其他車輛、行人等。
上述所有任務均能利用計算機視覺系統進行實時探查,從而規(guī)避碰撞事故并確保駕駛安全性。
計算機視覺充滿挑戰(zhàn)性
當前計算機視覺的應用已開始向我們涉及的各行各業(yè)滲透。從能夠探查故障設備或破損設備到精準地診斷出癌癥,計算機視覺有能力提升各系統的能力并挽救生命。
但是,該技術也絕非沒有挑戰(zhàn)。計算機視覺仍遠不及人眼視覺。我們人類進化了數千年,從而使我們能夠識別并了解幾乎實時發(fā)生在我們身邊的所有事情。然而,我們仍不清楚人腦是如何執(zhí)行這類任務的。
深度學習是在正確道路/方向上邁出的一大步,但仍需要海量的工作量來創(chuàng)建一個系統,以確保該系統能執(zhí)行人類輕松搞定的任務,例如:識別道路上的某輛汽車。然而,研發(fā)一臺可理解視覺世界所有復雜性的計算機卻完全是另外一碼事了。
在人工智能應用和人類生物學方面還需要進行更多的研究,我們希望能在不久的將來看到計算機視覺技術的可應用領域呈現爆發(fā)式增長。(本文為編譯作品,所用英文原文和圖片選自makeuseof)

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月23日火熱報名中>> 2025是德科技創(chuàng)新技術峰會
-
10月23日立即報名>> Works With 開發(fā)者大會深圳站
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯網行業(yè)年度評選
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
11月28日立即下載>> 【白皮書】精準洞察 無線掌控——283FC智能自檢萬用表
-
8 每日AI全球觀察
- 1 特斯拉工人被故障機器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 AI 時代,阿里云想當“安卓” ,那誰是“蘋果”?
- 4 拐點已至!匯川領跑工控、埃斯頓份額第一、新時達海爾賦能扭虧為盈
- 5 硬剛英偉達!華為發(fā)布全球最強算力超節(jié)點和集群
- 6 隱退4年后,張一鳴久違現身!互聯網大佬正集體殺回
- 7 L3自動駕駛延期,逼出車企技術自我淘汰
- 8 谷歌“香蕉”爆火啟示:國產垂類AI的危機還是轉機?
- 9 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進軍好萊塢
- 10 機器人9月大事件|3家國產機器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!