This page is intended for users in Malaysia. Go to the page for users in United States.

PointNetの紹介

この記事をご覧の皆様、初めまして。クロスコンパス・インターン生の李亜超です。

今回は、CVPR2017には発表された論文「PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation」について解説していきます。

Introduction


PointNetは、2016年にスウェーデン大学によって提出された点群分類/セグメント深層学習フレームワークです。点群は、分類または分割の際に不規則な空間的関係を持つという特徴があるため、既存の画像分類および分割フレームワークを点群に直接適用することはできません。したがって、点群の分野では点群ボクセル化(グリッド)に基づく多くのディープラーニングフレームワークが作成されており、高い実績を出しています。

しかし、上記のフレームワークにおける点群データ処理の難しい点として、点群をボクセル化の際に、必然的に点群データの空間特性が変化し、不要なデータ損失と処理が発生することが挙げられます。この問題に対して、PointNetは点群の空間特性を最大限残すための独自の点群入力方式を使用し、最終テストで良好な結果を残しました。

対称デザイン

点群データの処理には要求がいくつかあり、その一つのは「データの無秩序」があります。PointNetでは対称デザインにより、この「データの無秩序」を実現します。

「データの無秩序」とは、ネットワークがデータポイントの順序を変更しても同じ結果を出力できることで、MaxPoolingを対称関数として使用することによってデータの入力の順序に関係なく同じ結果を出力させ、「データの無秩序」を実現します。


構造


ネットワーク入力はサンプリングnの3次元データです。この入力データはmlp(多層パーセプトロン)のいくつかのステップを経た後に、n * 1024次元のデータに変換され、前述したMaxPool対象関数により、1024次元の全体的な特性を取得します。分類モデル(Classification)として使用する場合、n*1024次元のデータは次元圧縮の後に、softmax分類確率を出力します。

セグメンテーションモデルとして使用する場合は、マルチレイヤネットワーク出力の前に、全体的なフィーチャがサンプリングポイントフィーチャに接続されます。

結果

ここではモデル分類、セグメンテーションの各問題設定において、PointNetを他の代表的なモデルと比較した結果を述べます。

モデル分類の評価



Table.1は各種モデルの分類精度の比較表ですが、Pointnetは高い分類精度を達成しています。ただMVCNNより分類精度が低いですが、各モデルのパラメータの数およびサンプルあたりの処理量を比較したTable6.からPointNetの方が少ないパラメータと処理量で分類が実施されていることがわかります。

モデルセグメンテーション評価


セグメンテーションの方もPointNetはbaselineより高い精度を出しました。

総括

PointNetは、点群データのセグメンテーションと分類問題において高い精度を達成しました。しかし、PointNetはグローバル特徴だけを抽出し、ローカル特徴を無視してしまう問題があったため、これを改善するため、PointNet++が開発されました。

株式会社クロスコンパス's job postings
Anonymous
Picture?height=40&width=40
1 Likes
Anonymous
Picture?height=40&width=40
1 Likes

AI

Weekly ranking

Show other rankings
If this story triggered your interest, go ahead and visit them to learn more

Page top icon