拉斯维加斯金沙集团现状怎么样,威尼斯人娱乐城官方网站,金盛备用网站

您所在的位置：首頁(yè) - 科學(xué)研究 - 科研動(dòng)態(tài)

科研動(dòng)態(tài)

基于超圖特征增強(qiáng)與自適應(yīng)邏輯調(diào)整的長(zhǎng)尾圖像識(shí)別算法

日期：2024-10-29 | 訪(fǎng)問(wèn)量：

中文題目：基于超圖特征增強(qiáng)與自適應(yīng)邏輯調(diào)整的長(zhǎng)尾圖像識(shí)別算法

論文題目：Dual-branch Network with Hypergraph Feature Augmentation and Adaptive Logits Adjustment for Long-tailed Visual Recognition

錄用期刊/會(huì)議：Applied Soft Computing （中科院一區(qū)、TOP期刊）

錄用時(shí)間：2024.10.10

作者列表：

1) 韓佳藝中國(guó)石油大學(xué)（北京）人工智能學(xué)院控制科學(xué)與工程博22級(jí)

2) 劉建偉中國(guó)石油大學(xué)（北京）人工智能學(xué)院自動(dòng)化系教師

3) 徐璟東中國(guó)石油大學(xué)（北京）人工智能學(xué)院控制科學(xué)與工程碩22級(jí)

摘要:

本文提出了一種基于解耦學(xué)習(xí)框架的超圖特征增強(qiáng)和自適應(yīng)邏輯調(diào)整的長(zhǎng)尾視覺(jué)識(shí)別（HALR）算法。對(duì)于表征學(xué)習(xí)任務(wù)，我們從混合輸入樣本中提取超圖特征，以捕獲圖像的全局空間上下文語(yǔ)義信息。對(duì)于分類(lèi)器學(xué)習(xí)任務(wù)，我們提出了一個(gè)自適應(yīng)邏輯調(diào)整函數(shù)，該函數(shù)自動(dòng)糾正預(yù)測(cè)分?jǐn)?shù)偏差，從而產(chǎn)生魯棒決策邊界。

背景與動(dòng)機(jī):

長(zhǎng)尾分布存在數(shù)據(jù)稀缺性和顯著的類(lèi)不平衡問(wèn)題，導(dǎo)致模型對(duì)頭類(lèi)的預(yù)測(cè)傾向增加，對(duì)尾類(lèi)的預(yù)測(cè)性能降低。傳統(tǒng)的長(zhǎng)尾學(xué)習(xí)方法可以緩解尾類(lèi)的信息缺失問(wèn)題。然而，這些方法沒(méi)有充分利用圖像中包含的復(fù)雜非線(xiàn)性高階關(guān)系以及頭尾類(lèi)之間的交互信息。在尾類(lèi)數(shù)據(jù)稀缺的情況下，如何充分利用有限樣本中的隱含信息是一個(gè)亟待解決的問(wèn)題。

針對(duì)這些問(wèn)題，我們提出了一種基于超圖特征增強(qiáng)和自適應(yīng)邏輯調(diào)整的長(zhǎng)尾雙分支模型。超圖特征增強(qiáng)策略?xún)?yōu)化潛在特征表示，邏輯調(diào)整函數(shù)自動(dòng)校準(zhǔn)模型置信度偏差。我們的HALR同時(shí)改進(jìn)了解耦長(zhǎng)尾學(xué)習(xí)的表征學(xué)習(xí)和分類(lèi)器學(xué)習(xí)任務(wù)。此外，我們采用余弦相似度度量學(xué)習(xí)方法來(lái)約束全局和局部混合一致性。在四個(gè)基準(zhǔn)數(shù)據(jù)集的大量實(shí)驗(yàn)證實(shí)了我們提出的模型的有效性。

主要內(nèi)容:

圖1 HALR流程圖

超圖是一種通用的圖結(jié)構(gòu)方法，能夠更準(zhǔn)確地表示多個(gè)相關(guān)對(duì)象之間的關(guān)系。因此，利用超圖挖掘圖像特征中的結(jié)構(gòu)信息，從全局的角度學(xué)習(xí)圖像的空間上下文語(yǔ)義信息。超圖卷積定義為：

我們利用超圖卷積捕捉圖像中隱含的語(yǔ)義信息，并將提取到的超圖增強(qiáng)特征為：

與原特征融合后的最終輸出特征為：

面對(duì)模型分類(lèi)偏差的問(wèn)題，大多數(shù)解耦學(xué)習(xí)方法依賴(lài)于數(shù)據(jù)集中預(yù)先存在的分布假設(shè)，并手動(dòng)設(shè)置靜態(tài)參數(shù)進(jìn)行重采樣或重加權(quán)。然而，這種人工參數(shù)設(shè)置需要廣泛的專(zhuān)家知識(shí)，配置不當(dāng)會(huì)嚴(yán)重影響學(xué)習(xí)算法的泛化能力。為此，我們提出一種自適應(yīng)邏輯調(diào)整函數(shù)，以提高模型的適應(yīng)性和泛化能力。該方法動(dòng)態(tài)關(guān)注每個(gè)輸入樣本，根據(jù)數(shù)據(jù)集的實(shí)際分布和樣本本身的難度自動(dòng)修正兩個(gè)分支的logits輸出，表示為：

實(shí)驗(yàn)結(jié)果與分析:

我們?cè)谒膫€(gè)廣泛使用的長(zhǎng)尾數(shù)據(jù)集上評(píng)估了我們提出的HALR的性能：CIFAR10-LT， CIFAR100-LT， ImageNet-LT和iNaturalist2018。

圖 2 數(shù)據(jù)集示意圖

部分實(shí)驗(yàn)結(jié)果如表所示，我們?cè)诟鱾€(gè)數(shù)據(jù)集上，展現(xiàn)了出色的競(jìng)爭(zhēng)力：

表1 對(duì)不同不平衡因素下CIFAR10-LT的w.r.t top-1測(cè)試精度（%）進(jìn)行基準(zhǔn)測(cè)試

結(jié)論:

本文旨在解決長(zhǎng)尾視覺(jué)識(shí)別任務(wù)中數(shù)據(jù)信息挖掘不足和模型置信度偏差的問(wèn)題，提出了一種超圖特征增強(qiáng)和自適應(yīng)邏輯調(diào)整的雙分支網(wǎng)絡(luò)，有效提升了模型的性能。超圖特征增強(qiáng)方法將視覺(jué)長(zhǎng)尾學(xué)習(xí)從傳統(tǒng)的歐氏空間擴(kuò)展到非歐氏空間。使用超圖特征作為輔助知識(shí)，有助于模型挖掘圖像中隱含的上下文空間語(yǔ)義信息。實(shí)驗(yàn)表明，該方法在面對(duì)有限樣本時(shí)增強(qiáng)了模型對(duì)尾部類(lèi)的理解。自適應(yīng)logits調(diào)節(jié)函數(shù)為模型提供了動(dòng)態(tài)校準(zhǔn)置信度的能力，從而緩解頭類(lèi)偏好問(wèn)題，靈活地修正分類(lèi)偏差。在CIFAR10/100-LT等4個(gè)基準(zhǔn)數(shù)據(jù)集上的廣泛實(shí)驗(yàn)驗(yàn)證了HALR顯著提高了長(zhǎng)尾圖像分類(lèi)性能，特別是在解決尾類(lèi)樣本稀缺問(wèn)題方面表現(xiàn)出巨大潛力。在不平衡因子為10和100的CIFAR100數(shù)據(jù)集上，HALR分別取得了88.25%和58.27%的最佳top-1測(cè)試精度。

作者簡(jiǎn)介:

劉建偉，教師，學(xué)者。發(fā)表學(xué)術(shù)研究論文280多篇。研究領(lǐng)域涉及在線(xiàn)學(xué)習(xí)（包括強(qiáng)化學(xué)習(xí)，賭博機(jī)算法，持續(xù)學(xué)習(xí)，長(zhǎng)尾學(xué)習(xí)）；圖像視頻顯著性目標(biāo)檢測(cè)，解糾纏表示學(xué)習(xí)，光場(chǎng)和神經(jīng)場(chǎng)模型，以及圖像視頻少樣本變化檢測(cè)；自然語(yǔ)言理解中的知識(shí)補(bǔ)全，圖神經(jīng)網(wǎng)絡(luò)；不平衡數(shù)據(jù)處理；霍克斯點(diǎn)過(guò)程故障預(yù)測(cè)與診斷；非線(xiàn)性預(yù)測(cè)與控制。是兵器裝備工程學(xué)報(bào)第三屆編輯委員會(huì)委員。歷屆中國(guó)控制會(huì)議(CCC)和中國(guó)控制與決策會(huì)議(CCDC)的程序委員會(huì)委員。擔(dān)任過(guò)80多個(gè)國(guó)際會(huì)議的TPC。

金沙娱乐场官方网-澳门金沙会官网-金沙集团股价实情信息最新

科研動(dòng)態(tài)

基于超圖特征增強(qiáng)與自適應(yīng)邏輯調(diào)整的長(zhǎng)尾圖像識(shí)別算法