8月2日至4日,實驗室王嘉毅和王梓懿同學(xué)參加了在云南昆明舉辦的2023中國多媒體大會(ChinaMM2023),并展示了論文《基于小波變換和平行注意力機制的多源遙感圖像分類方法》 、《基于旋轉(zhuǎn)目標(biāo)感知網(wǎng)絡(luò)的SAR船舶檢測方法》和《基于Transformer和通道混合并行卷積的高光譜圖像去噪方法》。


基于小波變換和平行注意力機制的多源遙感圖像分類方法由王嘉毅和張?zhí)旄旰献魍瓿?,該方法?gòu)建了基于小波變換的特征提取器,能夠充分利用頻域分析技術(shù),在可逆下采樣的過程中充分捕捉粗/細(xì)粒度級別特征;同時,提出了基于平行注意力機制的特征融合器,充分綜合多模態(tài)遙感數(shù)據(jù)的一致性和差異性,完成強相關(guān)性特征的融合和生成,可以顯著提升多源遙感圖像分類的準(zhǔn)確率。
基于旋轉(zhuǎn)目標(biāo)感知網(wǎng)絡(luò)的SAR船舶檢測方法由王梓懿、尹嘉豪、黃博斌合作完成。為了解決目標(biāo)尺寸變化多樣的問題,該方法主干網(wǎng)絡(luò)使用基于多尺度 Transformer 架構(gòu)的 PVTv2,可以更好地保留特征圖的局部連續(xù)性,同時更好地融合圖像的多尺度特征。同時,為了解決目標(biāo)有多種方向且訓(xùn)練樣本數(shù)量有限的問題,將旋轉(zhuǎn)邊界框與 RetinaNet 結(jié)合,有效減少了背景冗余以及噪聲的干擾。
基于Transformer和通道混合并行卷積的高光譜圖像去噪方法由胡帥、龔卓然、上官心語合作完成,模型包括三個關(guān)鍵模塊:通道混合特征提取模塊、基于塊下采樣的全局增強模塊和自適應(yīng)雙向特征融合模塊。通過這三個模塊的相互作用,可以充分結(jié)合全局和局部的特征信息,處理不同區(qū)域中的噪聲和紋理差異,有效提高模型對空間細(xì)節(jié)信息的恢復(fù)能力。
目前,這三個工作分別被推薦到《中國圖象圖形學(xué)報》和《北京航空航天大學(xué)學(xué)報》發(fā)表。

2023中國多媒體大會由中國計算機學(xué)會(CCF)、中國圖像圖形學(xué)學(xué)會(CSIG)主辦,CCF多媒體技術(shù)專業(yè)委員會、CSIG多媒體專業(yè)委員會、云南大學(xué)承辦,昆明理工大學(xué)、云南師范大學(xué)和云南民族大學(xué)聯(lián)合承辦,參會人數(shù)超過1000人,通過面對面交流,共同促進多媒體領(lǐng)域的蓬勃發(fā)展。