CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)
經(jīng)過圖像處理后,每個循環(huán)群
將變化為
:
命題3里,我們假設(shè)T和J具備交換律,那么我們可以將上面的公式改寫,并得到
:
原分布D不具備視覺手性意味著:每個循環(huán)群
中的元素都有相同的概率出現(xiàn)。因此,由于經(jīng)過J圖像處理后循環(huán)群變?yōu)榱?/p>
,我們只需要證明以下運算為同態(tài)(homomorphism):
因為對于同態(tài)來說,根據(jù)第一同構(gòu)基本定理(First Isomorphism Theorm)可以推理出每個輸出對應(yīng)著相同數(shù)量的輸入。而因為每個循環(huán)群中單個輸入
在原分布D上有著相同的概率,意味著每個輸出
也具備相同的概率,也意味著
不具備視覺手性。證明同態(tài)的步驟如下:
以上為命題3的證明。通過命題3,我們知道了J和T的交換律與處理后圖像分布的視覺手性的關(guān)系。那么,只需要通過檢查交換律,我們便可以判斷圖像處理是否可能產(chǎn)生新的視覺手性。檢查的方式也很簡單,對于任意圖片x,我們只需要計算其交換殘差(commutative residual)是否為0:
下圖形象的解釋了交換殘差的計算過程:
文中使用去馬賽克、JPEG壓縮、以及兩者結(jié)合這三種圖像處理方法,對于鏡像翻轉(zhuǎn)這一圖片變換方式分別計算了交換殘差。
當去馬賽克處理的圖像寬度為奇數(shù)時,處理后的圖像分布可能具備視覺手性;反之如果為偶數(shù),則不具備視覺手性。當JPEG壓縮的圖片不為16整除時,處理后的圖像分布可能具備視覺手性,反之則不具備。當兩者結(jié)合后,處理后的圖片一定具備視覺手性:
作者為了驗證這些結(jié)論,在原本不具備視覺手性的人工數(shù)據(jù)集(高斯分布生成的隨機圖片)上,對不同寬度的圖片分別進行了這三種處理,并使用神經(jīng)網(wǎng)絡(luò)進行了自監(jiān)督學習。實驗結(jié)果符合這一測試的預期。因為大量互聯(lián)網(wǎng)圖片都經(jīng)過了去馬賽克和JPEG壓縮,這一結(jié)論意味著數(shù)字圖像處理所帶來的視覺手性現(xiàn)象在互聯(lián)網(wǎng)圖片中廣泛存在。
當加入隨機剪裁(random cropping)后,我們還能得到這一結(jié)論么?作者的答復是肯定的。
為了理解隨機剪裁對于視覺手性的影響,作者提到了兩個關(guān)鍵點。
第一點:命題三中只討論了單種J的情況。而隨機剪裁可以被視為許多種J(例如
是向右平移一格并剪裁,
是向右平移兩個并剪裁)的結(jié)合,每一種有相同概率出現(xiàn)。
第二點:命題三中并沒有討論T和J不具備交換律的情況。例如當J是向?qū)D片右平移十個像素并進行一次中心剪裁時,T和J無法具備交換律。在這種情況下,新的圖像分布并不一定具備視覺手性。
對于第一點來說,假設(shè)我們有多種不同的J(例如
,
,
),而他們分別與T具備交換律時,我們可以用以下公式表達新的圖像分布:

請輸入評論內(nèi)容...
最新活動更多
推薦專題
- 1 特斯拉工人被故障機器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 AI 時代,阿里云想當“安卓” ,那誰是“蘋果”?
- 4 拐點已至!匯川領(lǐng)跑工控、埃斯頓份額第一、新時達海爾賦能扭虧為盈
- 5 L3自動駕駛延期,逼出車企技術(shù)自我淘汰
- 6 隱退4年后,張一鳴久違現(xiàn)身!互聯(lián)網(wǎng)大佬正集體殺回
- 7 谷歌“香蕉”爆火啟示:國產(chǎn)垂類AI的危機還是轉(zhuǎn)機?
- 8 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進軍好萊塢
- 9 機器人9月大事件|3家國產(chǎn)機器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!
- 10 市值暴漲千億,這潑天富貴終于輪到百度了
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市