編號:CYYJ01677
篇名:基于多粒度空間混亂的細(xì)粒度圖像分類算法
作者:宋思雨 苗奪謙
關(guān)鍵詞: 細(xì)粒度圖像分類 空間混亂 多粒度 深度學(xué)習(xí) 數(shù)據(jù)增強(qiáng) 卷積神經(jīng)網(wǎng)絡(luò) 弱監(jiān)督學(xué)習(xí) 局部區(qū)域
機(jī)構(gòu): 同濟(jì)大學(xué)電子與信息工程學(xué)院 同濟(jì)大學(xué)嵌入式系統(tǒng)與服務(wù)計(jì)算教育部重點(diǎn)實(shí)驗(yàn)室
摘要: 細(xì)粒度圖像分類是計(jì)算機(jī)視覺領(lǐng)域一個(gè)具有挑戰(zhàn)性的任務(wù),在實(shí)際場景中具有很高的應(yīng)用價(jià)值。其中不同子類別的物體整體輪廓差異較小,微小的判別性局部區(qū)域是分類的關(guān)鍵。然而,這些重要的局部區(qū)域的尺度可能不同,不能用單一的標(biāo)準(zhǔn)去衡量它們。為了解決這個(gè)問題,本文提出了多粒度空間混亂模塊來幫助神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)如何尋找到不同尺度的判別性細(xì)節(jié)。該模塊首先將圖片劃分為不同粒度的局部區(qū)域,然后隨機(jī)打亂并重組構(gòu)成新的輸入圖片。經(jīng)過處理的圖片具有區(qū)域無關(guān)性,從而迫使網(wǎng)絡(luò)更好地在不同粒度層次下尋找有判別力的局部區(qū)域并從中學(xué)習(xí)特征。在3個(gè)廣泛使用的細(xì)粒度圖像分類數(shù)據(jù)集上的實(shí)驗(yàn)證明本文提出的模塊可以有效地幫助網(wǎng)絡(luò)尋找判別性局部區(qū)域從而提升了準(zhǔn)確率并且網(wǎng)絡(luò)不需要圖片的任何部位標(biāo)注信息。