作成者 :(株)クラスキャット セールスインフォメーション
作成日 : 01/11/2019
ClassCat® TF / ONNX Hub とは
「ClassCat® TF / ONNX Hub」はクラスキャットが提供する実用性の高い機械学習モデルのレポジトリです。各モデルは TensorFlow 固有フォーマットと ONNX フォーマットの両者で提供されます。 [ClassCat® ONNX Hub 詳細]
- ONNX (Open Neural Network Exchange) は深層学習モデルのためのオープンなフォーマットで、異なるオープンソースの深層学習フレームワーク間の相互作用を可能にします。
「ClassCat TF / ONNX Hub」で提供されるモデルについてはクラスキャットが検証の上で仕様を公開致しますので、ユーザ企業は希望するモデルを自由に選択することができます。更に (ユーザ企業の保持するデータセットによる) 再調整も含めて配備・実運用するために必要なトータルサポートを提供致します。
本ページでは提供モデルとして 物体検出モデル の代表例である、Mask R-CNN をサポートする Detectron 互換モデルを紹介致します。
物体検出とは
「物体検出」は画像の複数種類の物体の位置を特定してクラス分類することを可能にする、実用的で応用範囲が広い技術です。
深層学習技術の普及により画像全体の情報からクラス分類を行なう「物体認識」については畳み込みニューラルネットワーク (CNN) の利用により手軽に成果が出せるようになりました。典型的な例が MNIST や CIFAR10 の分類タスクです。しかしながら、画像上の複数種類の物体の位置を特定して各々の物体をクラス分類する「物体検出」を行なうためには更に多岐に渡る技術が必要となります。
物体検出技術は精度と速度のトレードオフがあり、高精度と高速化を求めて現在でも改良が重ねられています。その中心的なアルゴリズムとしては Fast R-CNN, Faster R-CNN, YOLO 更には SSD などが考案され実装されてきました。
最新技術としては Mask R-CNN が有名です。Mask R-CNN は物体検出した領域についてセマンティック・セグメンテーションも遂行します。
Detectron
Detectron は FAIR (Facebook AI Research) が開発して 2018 年にオープンソース化した物体検出フレームワークです。Detectron は Mask R-CNN で有名になりましたが最新の物体検出技術を多く包含しており Caffe2 で実装されています。現在では、様々なドメインにおける物体検出とセマンティック・セグメンテーションの集大成とも言えるプラットフォームに進化しています。
Mask R-CNN 対応 Detectron 互換 物体検出モデルの紹介
Detectron は優れた物体検出プラットフォームですが、反面、あらゆるドメインの物体検出やセマンティック・セグメンテーション技術を取り入れているために手軽に利用しにくいという問題があります。あるいは Caffe2 実装が望ましくないケースもあるかもしれません。
クラスキャットでは、機能を Faster R-CNN と Mask R-CNN 中心に限定した Detectron 互換モデルを ClassCat TF/ONNX Hub モデルとして提供しております。
ここではその出力例を紹介します。Mask R-CNN によるセグメンテーションの精度が非常に高いことが見て取れるでしょう :
※ 画像は原則として ImageNet の URL を利用しており、元画像の版権は所有者に帰属しています。
Faster R-CNN & Mask R-CNN
最初は物体検出タスクで頻繁に利用される元画像で試します。
左側の画像は Faster R-CNN のみを適用したもので、右側の画像は Mask R-CNN も併せて適用しています :
![]() |
![]() |
![]() |
![]() |
次に会議室と部屋の画像から検出。
デスクや人間などの大きな物体のみならず、ボトル、マウスや書籍なども検出しています :
![]() |
![]() |
![]() |
![]() |
車道画像から :
![]() |
![]() |
![]() |
![]() |
Mask R-CNN
最後に、セマンティック・セグメンテーションで良く使用される画像に Mask R-CNN を適用してみます :
![]() |
![]() |
![]() |
![]() |
以上