近日,莫大-北理工-深北莫應(yīng)用數(shù)學(xué)聯(lián)合研究中心李春團(tuán)隊(duì)研究生薛志鵬以第一作者身份,李春為通訊作者,在國(guó)際計(jì)算機(jī)圖形學(xué)領(lǐng)域權(quán)威期刊《IEEE Transactions on Image Processing》(TIP)發(fā)表題為《Uncertainty Quantification for Incomplete Multi-View Data Using Divergence Measures》的研究成果。該期刊影響因子高達(dá) 13.7,為中科院1區(qū)、CCF A類(lèi)頂級(jí)學(xué)術(shù)期刊,論文錄用需在理論與工程實(shí)踐上對(duì)相關(guān)領(lǐng)域有重要推動(dòng)作用,此次成果彰顯了深北莫團(tuán)隊(duì)強(qiáng)勁的科研實(shí)力。


圖一:論文期刊及索引
本研究針對(duì)現(xiàn)有多視圖分類(lèi)與聚類(lèi)方法在面對(duì)噪聲或缺失視圖時(shí),常依賴(lài) Kullback–Leibler 散度而忽視跨模態(tài)差異的問(wèn)題,提出了基于 Proper H?lder 散度(PHD)的 KPHD-Net 模型。KPHD-Net 首次將變分狄利克雷分布用于表征類(lèi)別概率分布,結(jié)合 Dempster–Shafer 證據(jù)理論與卡爾曼濾波,實(shí)現(xiàn)了多視圖證據(jù)的動(dòng)態(tài)融合與不確定性量化。理論分析與大量實(shí)驗(yàn)證明,PHD 相較于傳統(tǒng) KLD 能更有效地度量分布差異,從而顯著提升分類(lèi)與聚類(lèi)的準(zhǔn)確性、魯棒性和可靠性。

圖二:不完整多視圖數(shù)據(jù)不確定性量化框架概述
在 ADE20K、Caltech101-7、MSRC-v1 等多模態(tài)數(shù)據(jù)集上,KPHD-Net 在各種噪聲水平與缺失率條件下均表現(xiàn)出優(yōu)異性能,分類(lèi)準(zhǔn)確率提升 5% 以上,聚類(lèi)魯棒性顯著增強(qiáng)。該成果不僅為多視圖學(xué)習(xí)提供了全新的不確定性量化框架,也為后續(xù)在醫(yī)學(xué)影像、智能感知等領(lǐng)域的應(yīng)用奠定了理論與方法基礎(chǔ)。

圖三:Caltech101-7 與 Caltech101-20 數(shù)據(jù)集上的多視圖聚類(lèi)結(jié)果 t-SNE 可視化。

圖四:在不同高斯噪聲水平下 ADE20K 實(shí)驗(yàn)分類(lèi)結(jié)果匯總
本研究提出了 KPHD-Net,一種結(jié)合卡爾曼濾波、Proper H?lder 散度與主觀(guān)邏輯的多視圖學(xué)習(xí)框架,通過(guò)動(dòng)態(tài)證據(jù)融合對(duì)分類(lèi)與聚類(lèi)進(jìn)行不確定性量化;在 ADE20K、MSRC-v1、Caltech101-7/20 等數(shù)據(jù)集上,KPHD-Net 在各種噪聲水平(σ2=0.03)及缺失率條件下均顯著優(yōu)于現(xiàn)有方法,保持了高準(zhǔn)確率與穩(wěn)定性;此外,無(wú)論選用 ResNet50、DenseNet、Mamba 還是 ViT 等主干網(wǎng)絡(luò),均展現(xiàn)出穩(wěn)定且優(yōu)異的性能提升,充分證明其通用性與可靠性。該成果不僅為多視圖學(xué)習(xí)構(gòu)建了全新的不確定性量化框架,更為醫(yī)學(xué)影像智能分析、智能感知等前沿領(lǐng)域的應(yīng)用筑牢理論根基。未來(lái),團(tuán)隊(duì)計(jì)劃進(jìn)一步優(yōu)化模型,增強(qiáng)其在復(fù)雜場(chǎng)景下的適應(yīng)性,拓展應(yīng)用邊界。
李春領(lǐng)銜的團(tuán)隊(duì)長(zhǎng)期深耕學(xué)術(shù)研究與成果轉(zhuǎn)化,聚焦醫(yī)學(xué)影像、人工智能視覺(jué)技術(shù)、圖形圖像處理、機(jī)器學(xué)習(xí)等前沿方向,已在多項(xiàng)關(guān)鍵技術(shù)上取得突破,并積極推動(dòng)科研成果向臨床應(yīng)用與產(chǎn)業(yè)實(shí)踐轉(zhuǎn)化,持續(xù)為相關(guān)領(lǐng)域發(fā)展注入創(chuàng)新動(dòng)力。
論文鏈接:https://ieeexplore.ieee.org/document/11045813