TensorFlow GoogLeNet の特徴マップの可視化

Posted on 02/06/2017 by Sales Information

TensorFlow GoogLeNet Inception-v3 の特徴マップの可視化

単純な ConvNet モデルや AlexNet モデルで MNIST / CIFAR-10 の特徴マップやフィルタを TensorFlow で実装して可視化しましたが、より本格的なモデルで試してみます。

今回は TensorFlow で提供されている、トレーニング済みの GoogLeNet Inception-v3 モデルを使用しました。層数が多いので全ての層の出力を確認するのは煩雑なので、入力直後の畳込み層と最後の畳込み層からの出力、そして次元が圧縮されてサイズが縮小された際の特徴マップを適当な畳込み層から選択して可視化してみました。

GoogLeNet TensorFlow 実装の特徴マップ

以下は、入力前のサンプル画像です。
左が元画像、右が正規化後の画像を 3 チャネルで分解してグレースケール表示したものです :

incept3_features_tulip00.sample

incept3_features_tulip00.sample2

* 元画像は ImageNet からピックアップしています。版権は所有者に帰属します。

以下は、最初の畳込み層からの出力マップです。サイズは 111 x 111。
明るさと輝度は調整してあります :
incept3_features_tulip00.111x111

以下は、54 x 54 の特徴マップを出力する中間層からの出力です :
incept3_features_tulip00.54x54

以下は、25 x 25 の特徴マップを出力する中間層からの出力です :
incept3_features_tulip00.25x25

以下は、12 x 12 の特徴マップを出力する中間層からの出力です :
incept3_features_tulip00.12x12

そして以下は、最後の特徴マップ出力になります :
incept3_features_tulip00.5x5

別例です。クラスキャットのマスコット猫です。
左が元画像、右が正規化後の画像を 3 チャネルで分解してグレースケール表示したものです :

incept3_features_sora02.sample

incept3_features_sora02.sample2

以下は、最初の畳込み層からの出力マップです。サイズは 111 x 111 :
incept3_features_sora02.111x111

以下は、54 x 54 の特徴マップを出力する中間層からの出力です :
incept3_features_sora02.54x54

以下は、25 x 25 の特徴マップを出力する中間層からの出力です :
incept3_features_sora02.25x25

以下は、12 x 12 の特徴マップを出力する中間層からの出力です :
incept3_features_sora02.12x12

そして以下は、最後の特徴マップ出力です :
incept3_features_sora02.5x5

以上