深度學(xué)習(xí)可以解決自我駕駛問題嗎?
在計算機(jī)視覺文獻(xiàn)中存在很多立體深度估計算法,但它們都無法同時實現(xiàn):實時處理、高精確度、全自動的。
人類使用立體視覺(Eyes),即使深度僅為一幅圖像,也能出色地估計深度。甚至可以閉上一只眼睛,并且仍然可以合理地估計深度!
人類是否真的在“學(xué)習(xí)”如何感知深度?我們無法真正回答這個問題。
但是,深度仍然可以被視為學(xué)習(xí)問題,因此深度“足夠好”可以解決自我駕駛問題嗎?
現(xiàn)在有幾篇論文將視線深度估計作為學(xué)習(xí)問題:
1.監(jiān)督深度估計
“監(jiān)督”深度學(xué)習(xí)背后的概念很簡單,收集RGB圖像及其相應(yīng)的深度圖,訓(xùn)練類似于“自動編碼器”的體系結(jié)構(gòu)進(jìn)行深度估計。(盡管訓(xùn)練起來不那么簡單,但如果不通過訓(xùn)練過程整合一些特殊技巧,F(xiàn)CN就永遠(yuǎn)無法真正發(fā)揮作用:)。
盡管此方法更易于掌握,但在現(xiàn)實生活中收集深度圖是一項昂貴的任務(wù)。LiDAR數(shù)據(jù)可用于訓(xùn)練這類網(wǎng)絡(luò),因此,如果我們對由LiDAR收集的數(shù)據(jù)進(jìn)行訓(xùn)練,則神經(jīng)網(wǎng)絡(luò)的性能將明顯優(yōu)于LiDAR,但仍然可以,因為我們不需要那種級別的準(zhǔn)確性來駕駛汽車?yán),知道樹上是否有葉子的確切距離。
2.無監(jiān)督深度估計
僅在一系列環(huán)境中記錄質(zhì)量深度數(shù)據(jù)是一個具有挑戰(zhàn)性的問題。無監(jiān)督方法可以在沒有地面真實深度圖的情況下學(xué)習(xí)深度!
“這種方法只是查看未標(biāo)記的視頻,并找到一種方法來創(chuàng)建深度圖,方法不是嘗試正確,而是嘗試保持一致!
3.神經(jīng)網(wǎng)絡(luò)架構(gòu)
該網(wǎng)絡(luò)具有類似于U-Net的架構(gòu),編碼器部分是在ImageNet數(shù)據(jù)集上訓(xùn)練的預(yù)訓(xùn)練DenseNet模型。解碼器部分使用雙線性上采樣而不是簡單的上采樣。
簡而言之,我們使用雙線性上采樣是因為它在上采樣后會整體上產(chǎn)生“平滑”圖像。輸出是深度圖,深度圖是圖像大小的一半,這有助于網(wǎng)絡(luò)學(xué)習(xí)更快。
4.圖像增強(qiáng)
對于圖像增強(qiáng),可以使用以下技術(shù):圖像翻轉(zhuǎn),輸入圖像的色彩通道改組,向輸入圖像添加噪點,增加輸入圖像的對比度,亮度,溫度等。這樣可以確保模型在整個訓(xùn)練過程中始終看到新數(shù)據(jù),并更好地泛化未見數(shù)據(jù)。
目前,深度估計在AR / VR中已經(jīng)得到了許多應(yīng)用。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 特斯拉工人被故障機(jī)器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 AI 時代,阿里云想當(dāng)“安卓” ,那誰是“蘋果”?
- 4 拐點已至!匯川領(lǐng)跑工控、埃斯頓份額第一、新時達(dá)海爾賦能扭虧為盈
- 5 L3自動駕駛延期,逼出車企技術(shù)自我淘汰
- 6 隱退4年后,張一鳴久違現(xiàn)身!互聯(lián)網(wǎng)大佬正集體殺回
- 7 谷歌“香蕉”爆火啟示:國產(chǎn)垂類AI的危機(jī)還是轉(zhuǎn)機(jī)?
- 8 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進(jìn)軍好萊塢
- 9 機(jī)器人9月大事件|3家國產(chǎn)機(jī)器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!
- 10 市值暴漲千億,這潑天富貴終于輪到百度了
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市