172篇文獻：NUS顏水成等釋出首篇《深度長尾學習》綜述

2021-12-29由新智元發表于科技

新智元報道

【新智元導讀】

深度學習依賴於大量資料，但對於長尾類別來說，資料樣本較為稀缺。為此，深度長尾學習從大量遵循長尾類分佈的影象中訓練出效能良好的深度模型，得到大量研究。來自NUS的顏水成等學者釋出了首篇《深度長尾學習》綜述論文，值得關注！

論文連結：https：//arxiv。org/abs/2110。04596

摘要

深度長尾學習是視覺識別中最具挑戰性的問題之一，其目標是從大量遵循長尾類分佈的影象中訓練出效能良好的深度模型。在過去的十年中，深度學習已經成為一種學習高質量影象表示的強大的識別模型，並導致了一般視覺識別的顯著突破。

然而，長尾類不平衡是實際視覺識別任務中普遍存在的問題，這種不平衡往往限制了基於深度網路的識別模型在實際應用中的實用性，因為長尾類容易偏向主導類，在尾類上的表現較差。

為了解決這一問題，近年來人們進行了大量的研究，在深度長尾學習領域取得了可喜的進展。鑑於該領域的快速發展，本文對深度長尾學習的最新進展進行了綜述。

具體地說，我們將已有的深度長尾學習研究分為三類（即類重平衡、資訊增強和模組改進），並根據這三類對這些方法進行了詳細的回顧。

之後，我們透過一種新提出的評價指標，即相對準確性，來評估它們在多大程度上解決了階級失衡問題，從而對幾種最先進的方法進行了實證分析。

最後，我們強調了深度長尾學習的重要應用，並確定了未來研究的幾個有前景的方向。

引言

深度學習允許由多個處理層組成的計算模型學習具有多級抽象的資料表示，並在計算機視覺任務方面取得了令人難以置信的進展。

深度學習的關鍵因素是大規模資料集的可用性、GPU的出現和深度網路架構［9］的進步。深度神經網路具有很強的學習高質量資料表示的能力，在影象分類、目標檢測和語義分割等視覺識別任務中取得了巨大的成功。

在實際應用中，訓練樣本通常表現為長尾類分佈，其中一小部分類有大量的樣本點，而其他類只與少數樣本相關。然而，這種訓練樣本數量的類不平衡，使得基於深度網路的識別模型的訓練非常具有挑戰性。如圖1所示，訓練後的模型容易偏向訓練資料量大的頭類，導致模型在資料量有限的尾類上表現不佳。

因此，經驗風險最小化常用實踐訓練的深度模型無法處理長尾類不平衡的現實應用，如人臉識別，物種分類，醫學影象診斷，城市場景理解，無人機檢測等。

針對長尾類的不平衡，近年來開展了大量的深度長尾學習研究。儘管這一領域發展迅速，但仍沒有系統的研究來回顧和討論現有的進展。

為了填補這一空白，我們旨在對2021年年中之前進行的近期長尾學習研究進行全面綜述。

如圖2（下圖）所示，我們根據現有方法的主要技術貢獻將其分為三類，即類重平衡、資訊增強和模組改進；這些類別可以進一步分為九個子類別：重取樣、代價敏感學習、logit調整、遷移學習、資料增強、表示學習、分類器設計、解耦訓練和整合學習。

根據這一分類，我們對現有的方法進行了全面的回顧，並對幾種最先進的方法進行了實證分析，使用一個新的評價指標，即相對準確性來評價它們處理類不平衡的能力。我們透過介紹幾個真實的深度長尾學習的應用場景，並確定了幾個有前景的研究方向，可以由社群在未來探索。

我們總結了這項綜述的主要貢獻如下。

據我們所知，這是第一次對深度長尾學習的全面調研，將為研究人員和社群提供對深度神經網路的長尾視覺學習的更好理解。

我們提供了對高階長尾學習研究的深入回顧，並透過一個新的相對準確性度量來評估它們在多大程度上處理長尾類別失衡，以實證研究最先進的方法。

我們為未來的研究確定了四個潛在的方法創新方向以及八個新的深度長尾學習任務設定。

第二節介紹了問題的定義，並介紹了廣泛使用的資料集、度量和網路骨架。第3節全面回顧了先進的長尾學習方法，第4節基於一個新的評價指標實證分析了幾種最先進的方法。第5節給出了深度長尾學習的應用場景，第6節給出了未來的研究方向。我們在第7節結束調研。

相關推薦