訂閱
糾錯(cuò)
加入自媒體

動(dòng)態(tài)生成掩膜預(yù)測網(wǎng)絡(luò)生成模型CondInst,助力FCN重奪實(shí)例檢測顛峰

CondInst的主要架構(gòu),C表示主干網(wǎng)絡(luò)的特征圖,P則為FPN的特征圖。Fmask是對應(yīng)的特征圖。head被作用于各個(gè)特征圖P得到分類結(jié)果和對應(yīng)的網(wǎng)絡(luò)頭生成參數(shù)(動(dòng)態(tài)生成的maskFCN個(gè)數(shù)與實(shí)例個(gè)數(shù)相同)。

CondInst中使用了依賴實(shí)例的濾波器,隱式地將實(shí)例概念編碼到了mask頭的參數(shù)中去,更為靈活的處理。針對非規(guī)則形狀可以比規(guī)則的bbox更好的進(jìn)行處理,這是相較于ROI方法的優(yōu)勢之一。

CondInst構(gòu)建與目標(biāo)檢測架構(gòu)FCOS上,充分利用其簡單和靈活性。去除了FCOS的錨分支減少計(jì)算量。上圖中顯示了模型充分利用了特征金字塔,在每一層級都會有上圖虛線框中表示的功能層來進(jìn)行實(shí)例相關(guān)的預(yù)測,計(jì)算出目標(biāo)類別的實(shí)例和動(dòng)態(tài)生成濾波器的參數(shù)。上圖中還包括了mask分支從P3層引出來計(jì)算特征圖。

最終輸出的掩膜大小是原始圖像的1/8.為了獲取高分辨率的實(shí)例掩膜,利用4倍上采樣來得到最終的掩膜圖像。

實(shí)  驗(yàn)

為了充分研究這一模型的有效性,研究人員在COCO數(shù)據(jù)集上對模型進(jìn)行了訓(xùn)練。首先測試了mask端的寬度和深度,來選擇最為合適的架構(gòu)大小。

實(shí)驗(yàn)表明深度為1效果最差,這是由于模型沒有足夠的容量,而達(dá)到3后則增加不明顯甚至下降。針對模型的寬度研究發(fā)現(xiàn),這一因素對于模型的性能影響較小。針對寬度為8深度為3的基線mask head模型,在V100上其運(yùn)行時(shí)間僅僅需要4.5mm/100個(gè)實(shí)例,僅需要169個(gè)參數(shù)。這說明這種動(dòng)態(tài)生成方法對主干網(wǎng)絡(luò)造成的額外開銷非常少,與之對比的是Mask R-CNN的mask head則包含有2.3M個(gè)參數(shù)。

在選擇完合適的參數(shù)后,研究人員將設(shè)計(jì)好的架構(gòu)與多種先進(jìn)的方法進(jìn)行了比較,下表中可以看到這種方法在性能上超過了傳統(tǒng)的實(shí)例分割算法:

其中1x 代表90k迭代訓(xùn)練。aug代表了數(shù)據(jù)增強(qiáng)。w/sem是指利用了輔助的語義分割任務(wù)。

最后來一起看看這種緊湊高效的網(wǎng)絡(luò)結(jié)果,性能優(yōu)異速度又快,真香!


<上一頁  1  2  
聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號