Keras 2 : examples : 生成深層学習 – ディープドリーム (翻訳/解説)
翻訳 : (株)クラスキャット セールスインフォメーション
作成日時 : 07/03/2022 (keras 2.9.0)
* 本ページは、Keras の以下のドキュメントを翻訳した上で適宜、補足説明したものです:
- Code examples : Generative Deep Learning : Deep Dream (Author: fchollet)
* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。
- 人工知能研究開発支援
- 人工知能研修サービス(経営者層向けオンサイト研修)
- テクニカルコンサルティングサービス
- 実証実験(プロトタイプ構築)
- アプリケーションへの実装
- 人工知能研修サービス
- PoC(概念実証)を失敗させないための支援
- お住まいの地域に関係なく Web ブラウザからご参加頂けます。事前登録 が必要ですのでご注意ください。
◆ お問合せ : 本件に関するお問い合わせ先は下記までお願いいたします。
- 株式会社クラスキャット セールス・マーケティング本部 セールス・インフォメーション
- sales-info@classcat.com ; Web: www.classcat.com ; ClassCatJP
Keras 2 : examples : 生成深層学習 – ディープドリーム
Description : Keras でディープドリームを生成する。
イントロダクション
「ディープドリーム」は画像フィルタリング・テクニックで、これは画像分類モデルを取り、入力画像に対して特定の層 (そして時に、特定の層の特定のユニット) の活性の最大化を試みるために入力画像に勾配上昇を実行することから成ります。それは幻想のような映像を生成します。
それは最初に 2015年7月に Google の Alexander Mordvintsev により紹介されました。
プロセス :
- 元の画像をロードする。
- 処理スケール (“octaves”) の数を定義します、最小から最大までです。
- 元の画像を最小スケールにリサイズします。
- 総てのスケールについて、最小 (i.e. 現在のもの) から始めて : – 勾配上昇の実行 – 画像を次のスケールにアップスケール – アップスケーリング時に失われた詳細を再注入する。
- 元のサイズに戻ったときに停止します。アップスケーリングの際に失われた詳細を得るには、単純に元の画像を取り、それを縮小し、アップスケールし、そして結果を (リサイズされた) 元の画像と比較します。
セットアップ
import numpy as np
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.applications import inception_v3
base_image_path = keras.utils.get_file("sky.jpg", "https://i.imgur.com/aGBdQyK.jpg")
result_prefix = "sky_dream"
# These are the names of the layers
# for which we try to maximize activation,
# as well as their weight in the final loss
# we try to maximize.
# You can tweak these setting to obtain new visual effects.
layer_settings = {
"mixed4": 1.0,
"mixed5": 1.5,
"mixed6": 2.0,
"mixed7": 2.5,
}
# Playing with these hyperparameters will also allow you to achieve new effects
step = 0.01 # Gradient ascent step size
num_octave = 3 # Number of scales at which to run gradient ascent
octave_scale = 1.4 # Size ratio between scales
iterations = 20 # Number of ascent steps per scale
max_loss = 15.0
これがベース画像です :
from IPython.display import Image, display
display(Image(base_image_path))
幾つかの画像前処理 / deprocessing ユティリティをセットアップしましょう :
def preprocess_image(image_path):
# Util function to open, resize and format pictures
# into appropriate arrays.
img = keras.preprocessing.image.load_img(image_path)
img = keras.preprocessing.image.img_to_array(img)
img = np.expand_dims(img, axis=0)
img = inception_v3.preprocess_input(img)
return img
def deprocess_image(x):
# Util function to convert a NumPy array into a valid image.
x = x.reshape((x.shape[1], x.shape[2], 3))
# Undo inception v3 preprocessing
x /= 2.0
x += 0.5
x *= 255.0
# Convert to uint8 and clip to the valid range [0, 255]
x = np.clip(x, 0, 255).astype("uint8")
return x
ディープドリーム損失の計算
最初に、入力画像が与えられたときターゲット層の活性を取得する特徴抽出モデルを構築します。
# Build an InceptionV3 model loaded with pre-trained ImageNet weights
model = inception_v3.InceptionV3(weights="imagenet", include_top=False)
# Get the symbolic outputs of each "key" layer (we gave them unique names).
outputs_dict = dict(
[
(layer.name, layer.output)
for layer in [model.get_layer(name) for name in layer_settings.keys()]
]
)
# Set up a model that returns the activation values for every target layer
# (as a dict)
feature_extractor = keras.Model(inputs=model.inputs, outputs=outputs_dict)
実際の損失計算は非常に単純です :
def compute_loss(input_image):
features = feature_extractor(input_image)
# Initialize the loss
loss = tf.zeros(shape=())
for name in features.keys():
coeff = layer_settings[name]
activation = features[name]
# We avoid border artifacts by only involving non-border pixels in the loss.
scaling = tf.reduce_prod(tf.cast(tf.shape(activation), "float32"))
loss += coeff * tf.reduce_sum(tf.square(activation[:, 2:-2, 2:-2, :])) / scaling
return loss
one octave のための勾配上昇ループのセットアップ
@tf.function
def gradient_ascent_step(img, learning_rate):
with tf.GradientTape() as tape:
tape.watch(img)
loss = compute_loss(img)
# Compute gradients.
grads = tape.gradient(loss, img)
# Normalize gradients.
grads /= tf.maximum(tf.reduce_mean(tf.abs(grads)), 1e-6)
img += learning_rate * grads
return loss, img
def gradient_ascent_loop(img, iterations, learning_rate, max_loss=None):
for i in range(iterations):
loss, img = gradient_ascent_step(img, learning_rate)
if max_loss is not None and loss > max_loss:
break
print("... Loss value at step %d: %.2f" % (i, loss))
return img
異なる octave に渡りイテレートする、訓練ループの実行
original_img = preprocess_image(base_image_path)
original_shape = original_img.shape[1:3]
successive_shapes = [original_shape]
for i in range(1, num_octave):
shape = tuple([int(dim / (octave_scale ** i)) for dim in original_shape])
successive_shapes.append(shape)
successive_shapes = successive_shapes[::-1]
shrunk_original_img = tf.image.resize(original_img, successive_shapes[0])
img = tf.identity(original_img) # Make a copy
for i, shape in enumerate(successive_shapes):
print("Processing octave %d with shape %s" % (i, shape))
img = tf.image.resize(img, shape)
img = gradient_ascent_loop(
img, iterations=iterations, learning_rate=step, max_loss=max_loss
)
upscaled_shrunk_original_img = tf.image.resize(shrunk_original_img, shape)
same_size_original = tf.image.resize(original_img, shape)
lost_detail = same_size_original - upscaled_shrunk_original_img
img += lost_detail
shrunk_original_img = tf.image.resize(original_img, shape)
keras.preprocessing.image.save_img(result_prefix + ".png", deprocess_image(img.numpy()
Processing octave 0 with shape (326, 489) ... Loss value at step 0: 0.44 ... Loss value at step 1: 0.62 ... Loss value at step 2: 0.90 ... Loss value at step 3: 1.25 ... Loss value at step 4: 1.57 ... Loss value at step 5: 1.92 ... Loss value at step 6: 2.20 ... Loss value at step 7: 2.52 ... Loss value at step 8: 2.82 ... Loss value at step 9: 3.11 ... Loss value at step 10: 3.39 ... Loss value at step 11: 3.67 ... Loss value at step 12: 3.93 ... Loss value at step 13: 4.19 ... Loss value at step 14: 4.42 ... Loss value at step 15: 4.69 ... Loss value at step 16: 4.93 ... Loss value at step 17: 5.18 ... Loss value at step 18: 5.47 ... Loss value at step 19: 5.70 Processing octave 1 with shape (457, 685) ... Loss value at step 0: 1.08 ... Loss value at step 1: 1.74 ... Loss value at step 2: 2.30 ... Loss value at step 3: 2.79 ... Loss value at step 4: 3.21 ... Loss value at step 5: 3.64 ... Loss value at step 6: 4.04 ... Loss value at step 7: 4.42 ... Loss value at step 8: 4.78 ... Loss value at step 9: 5.13 ... Loss value at step 10: 5.49 ... Loss value at step 11: 5.82 ... Loss value at step 12: 6.14 ... Loss value at step 13: 6.43 ... Loss value at step 14: 6.78 ... Loss value at step 15: 7.07 ... Loss value at step 16: 7.36 ... Loss value at step 17: 7.64 ... Loss value at step 18: 7.94 ... Loss value at step 19: 8.21 Processing octave 2 with shape (640, 960) ... Loss value at step 0: 1.25 ... Loss value at step 1: 2.02 ... Loss value at step 2: 2.65 ... Loss value at step 3: 3.18 ... Loss value at step 4: 3.68 ... Loss value at step 5: 4.18 ... Loss value at step 6: 4.63 ... Loss value at step 7: 5.09 ... Loss value at step 8: 5.49 ... Loss value at step 9: 5.90 ... Loss value at step 10: 6.24 ... Loss value at step 11: 6.57 ... Loss value at step 12: 6.84 ... Loss value at step 13: 7.21 ... Loss value at step 14: 7.59 ... Loss value at step 15: 7.89 ... Loss value at step 16: 8.18 ... Loss value at step 17: 8.55 ... Loss value at step 18: 8.84 ... Loss value at step 19: 9.13
結果を表示します。
Hugging Face ハブにホストされている訓練済みモデルを使用して Hugging Face Spaces でデモを試すことができます。
display(Image(result_prefix + ".png"))
以上