編號(hào):CYYJ01672
篇名:基于ECA-Net與多尺度結(jié)合的細(xì)粒度圖像分類(lèi)方法
作者:毛志榮 都云程 肖詩(shī)斌 施水才
關(guān)鍵詞: 注意力機(jī)制 深度學(xué)習(xí) 細(xì)粒度圖像分類(lèi)
機(jī)構(gòu): 北京信息科技大學(xué)計(jì)算機(jī)學(xué)院 拓爾思信息技術(shù)股份有限公司
摘要: 針對(duì)細(xì)粒度圖像分類(lèi)問(wèn)題提出了一種有效的算法以實(shí)現(xiàn)端到端的細(xì)粒度圖像分類(lèi)。ECA-Net中ECA(efficient channel attention)模塊是一種性能優(yōu)勢(shì)顯著的通道注意力機(jī)制,將其與經(jīng)典網(wǎng)絡(luò)ResNet-50進(jìn)行融合構(gòu)成新的基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)ResEca;通過(guò)物體級(jí)圖像定位模塊與部件級(jí)圖像生成模塊生成物體級(jí)圖像和部件級(jí)圖像,并結(jié)合原始圖像作為網(wǎng)絡(luò)的輸入,構(gòu)建以ResEca為基礎(chǔ)的三支路網(wǎng)絡(luò)模型Tb-ResEca-Net(three branch of ResEca network)。該算法在公有數(shù)據(jù)集CUB-200-2011、FGVC-aircraft和Stanford cars datasets上進(jìn)行測(cè)試訓(xùn)練,分別取得了89.9%、95.1%和95.3%的準(zhǔn)確率。實(shí)驗(yàn)結(jié)果表明,該算法相較于其他傳統(tǒng)的細(xì)粒度分類(lèi)算法具有較高的分類(lèi)準(zhǔn)確率以及較強(qiáng)的魯棒性,是一種有效的細(xì)粒度圖像分類(lèi)方法。