【泡泡一分鐘】CorsNet:3D點雲配準的神經網路

每天一分鐘,帶你讀遍機器人頂級會議文章

標題:CorsNet:3D Point Cloud Registration by Deep Neural Network

作者:Akiyoshi Kurobe, Yusuke Sekikawa, Kohta Ishikawa, and Hideo Saito

編譯:鄺冰然

稽核:柴毅,王靖淇

這是泡泡一分鐘推送的第 805 篇文章,歡迎個人轉發朋友圈;其他機構或自媒體如需轉載,後臺留言申請授權

摘要

點雲配準是機器人和計算機視覺社群的關鍵問題。它是對一個點雲與另一個點雲對齊的剛性變換的估計。迭代最近點(ICP)是解決這個問題的一種眾所周知的經典方法,但它通常只有在源點雲和模板點雲大部分預先對齊時才能實現高度對齊。如果每個點雲距離較遠或包含重複結構,則容易陷入區域性最小值導致配準經常失敗。受PointNet的啟發,最近的研究開發了幾種基於深度學習的方法。PointNetLK是其中一種具有代表性的方法,它使用梯度方法透過Jacobian直接最佳化聚合特徵的距離。在本文中,我們提出了一種基於深度學習的點雲配準系統:CorsNet。由於CorsNet是將區域性特徵與全域性特徵連線起來並回歸點雲之間的對應關係,而不是直接構成或聚合特徵,因此比傳統方法集成了更多有用的資訊。為了進行比較,我們還開發了一種新穎的深度學習方法(DirectNet),可以直接回歸點雲之間的姿態。透過我們的實驗,我們表明CorsNet不僅比經典的ICP方法具有更高的準確度,而且比最近提出的基於學習的提案PointNetLK和DirectNet具有更高的準確度,包括已知和未知的類別。

【泡泡一分鐘】CorsNet:3D點雲配準的神經網路

圖1:綠色:源點雲,藍色:目標點雲,紅色:變換後的點雲。無論初始擾動如何,只有提出的方法才能實現準確配準

【泡泡一分鐘】CorsNet:3D點雲配準的神經網路

圖2:CorsNet網路架構。設P_S和P_T分別為源點雲和目標點雲。CorsNet主要由三個部分組成:(i)全域性特徵提取(由PointNet實行)(ii)對應關係估計和(iii)奇異值分解(SVD)。 該架構將 n 個點作為輸入,使用最大池化提取全域性特徵,並透過將全域性特徵與每個點特徵連線起來作為每點特徵。然後,將它們轉換為 n × 3,即 P_S 和 P_T 之間的對應關係。隨後,我們將此對應關係應用於 P_S 並使用 SVD 計算剛性變換。注意:MLP = 多層感知器。

圖3:DirectNet網路架構。設P_S和P_T分別為源點雲和目標點雲。DirectNet相比於CorsNet的網路架構更為簡單,直接預測旋轉R和平移t。該網路主要由兩個部分組成:(i)全域性特徵提取(由PointNet實行)和(ii)全域性估計。DirectNet也是將 n 個點作為輸入,使用最大池化提取全域性特徵,並將這些全域性特徵在水平方向上進行拼接。然後,將它們轉換為n x 6,即旋轉R∈三維實數集和平移t∈三維實數集。

【泡泡一分鐘】CorsNet:3D點雲配準的神經網路

圖4:配準結果(綠色:源點雲,藍色:目標點雲,紅色:變換後的點雲)

【泡泡一分鐘】CorsNet:3D點雲配準的神經網路

【泡泡一分鐘】CorsNet:3D點雲配準的神經網路

表I:同類別的比較

表II:不同類別之間的比較

【泡泡一分鐘】CorsNet:3D點雲配準的神經網路

圖5:VI-A和VI-B的結果。每條線顯示均方根誤差相對於初始角度的轉變

【泡泡一分鐘】CorsNet:3D點雲配準的神經網路

圖6:DirectNet,PointNetLK,ICP和本文方法四個方法的結果比較。(綠色:源點雲,藍色:目標點雲,紅色:變換後的點雲)

Abstract

Point cloud registration is a key problem for robotics and computer vision communities。 This represents estimating a rigid transform which aligns one point cloud to another。 Iterative closest point (ICP) is a well-known classical method for this problem, yet it generally achieves high alignment only when the source and template point cloud are mostly pre-aligned。 If each point cloud is far away or contains a repeating structure, the registration often fails because of being fallen into a local minimum。 Recently, inspired by PointNet, several deep learning-based methods have been developed。 PointNetLK is a representative approach, which directly optimizes the distance of aggregated features using gradient method by Jacobian。 In this paper, we propose a point cloud registration system based on deep learning: CorsNet。 Since CorsNet concatenates the local features with the global features and regresses correspondences between point clouds, not directly pose or aggregated features, more useful information is integrated than the conventional approaches。 For comparison, we also developed a novel deep learning approach (DirectNet) that directly regresses the pose between point clouds。 Through our experiments, we show that CorsNet achieves higher accuracy than not only the classic ICP method, but also the recently proposed learning-based proposal PointNetLK and DirectNet, including on seen and unseen categories。

TAG: 點雲CorsNetDirectNetpoint源點