Keras 2 : examples : 時系列 – Autoencoder を使用した時系列異常検知 (翻訳/解説)

翻訳 : (株)クラスキャットセールスインフォメーション
作成日時 : 06/14/2022 (keras 2.9.0)

* 本ページは、Keras の以下のドキュメントを翻訳した上で適宜、補足説明したものです：

Code examples : Timeseries : Timeseries anomaly detection using an Autoencoder (Author: pavithrasv)

* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。

クラスキャット人工知能研究開発支援サービス

◆ クラスキャットは人工知能・テレワークに関する各種サービスを提供しています。お気軽にご相談ください :

人工知能研究開発支援
1. 人工知能研修サービス(経営者層向けオンサイト研修)
2. テクニカルコンサルティングサービス
3. 実証実験(プロトタイプ構築)
4. アプリケーションへの実装
人工知能研修サービス
PoC(概念実証)を失敗させないための支援

◆ 人工知能とビジネスをテーマに WEB セミナーを定期的に開催しています。スケジュール。

お住まいの地域に関係なく Web ブラウザからご参加頂けます。事前登録 が必要ですのでご注意ください。

◆ お問合せ : 本件に関するお問い合わせ先は下記までお願いいたします。

株式会社クラスキャット セールス・マーケティング本部セールス・インフォメーション
sales-info@classcat.com ; Web: www.classcat.com ; ClassCatJP

Keras 2 : examples : 時系列 – Autoencoder を使用した時系列異常検知

Description : AutoEncoder を使用して時系列の異常を検出する。

イントロダクション

このスクリプトは時系列データの異常を検出するために再構築畳み込みオートエンコーダ・モデルをどのように利用できるかを実演します。

セットアップ

import numpy as np
import pandas as pd
from tensorflow import keras
from tensorflow.keras import layers
from matplotlib import pyplot as plt

データのロード

Numenta Anomaly Benchmark(NAB) データセットを使用します。それはラベル付けされた、挙動の異常期間を含む人工的な時系列データを提供します。データは順序付けられ、タイムスタンプが付けられた、単一値のメトリクスです。

訓練のために art_daily_small_noise.csv ファイル、そしてテストのために art_daily_jumpsupj.csv ファイルを使用します。このデータセットの単純さは異常検知を効果的に実演することを可能にします。

master_url_root = "https://raw.githubusercontent.com/numenta/NAB/master/data/"

df_small_noise_url_suffix = "artificialNoAnomaly/art_daily_small_noise.csv"
df_small_noise_url = master_url_root + df_small_noise_url_suffix
df_small_noise = pd.read_csv(
    df_small_noise_url, parse_dates=True, index_col="timestamp"
)

df_daily_jumpsup_url_suffix = "artificialWithAnomaly/art_daily_jumpsup.csv"
df_daily_jumpsup_url = master_url_root + df_daily_jumpsup_url_suffix
df_daily_jumpsup = pd.read_csv(
    df_daily_jumpsup_url, parse_dates=True, index_col="timestamp"
)

データを素早く見る

print(df_small_noise.head())

print(df_daily_jumpsup.head())

                         value
timestamp                     
2014-04-01 00:00:00  18.324919
2014-04-01 00:05:00  21.970327
2014-04-01 00:10:00  18.624806
2014-04-01 00:15:00  21.953684
2014-04-01 00:20:00  21.909120
                         value
timestamp                     
2014-04-01 00:00:00  19.761252
2014-04-01 00:05:00  20.500833
2014-04-01 00:10:00  19.961641
2014-04-01 00:15:00  21.490266
2014-04-01 00:20:00  20.187739

データの可視化

異常のない時系列データ

訓練のために以下のデータを使用します。

fig, ax = plt.subplots()
df_small_noise.plot(legend=False, ax=ax)
plt.show()

異常を含む時系列

テストのためには以下のデータを使用します、そしてデータ内の唐突なジャンプアップが異常として検出されているかを見ます。

fig, ax = plt.subplots()
df_daily_jumpsup.plot(legend=False, ax=ax)
plt.show()

訓練データの準備

訓練用時系列データファイルからデータ値を取得して値データを正規化します。14 日間分の 5 分毎の値を持ちます。

24 * 60 / 5 = 288 時間ステップ per day
288 * 14 = 4032 データポイント in total

# Normalize and save the mean and std we get,
# for normalizing test data.
training_mean = df_small_noise.mean()
training_std = df_small_noise.std()
df_training_value = (df_small_noise - training_mean) / training_std
print("Number of training samples:", len(df_training_value))

Number of training samples: 4032

シークエンスの作成

訓練データからの TIME_STEPS 連続データ値を連結したシークエンスを作成します。

TIME_STEPS = 288

# Generated training sequences for use in the model.
def create_sequences(values, time_steps=TIME_STEPS):
    output = []
    for i in range(len(values) - time_steps + 1):
        output.append(values[i : (i + time_steps)])
    return np.stack(output)


x_train = create_sequences(df_training_value.values)
print("Training input shape: ", x_train.shape)

Training input shape:  (3745, 288, 1)

モデルの構築

畳み込み再構築オートエンコーダ・モデルを構築します。このモデルは shape (batch_size, sequence_length, num_features) の入力を取り、同じ shape の出力を返します。この場合、sequence_length は 288 で num_features は 1 です。

model = keras.Sequential(
    [
        layers.Input(shape=(x_train.shape[1], x_train.shape[2])),
        layers.Conv1D(
            filters=32, kernel_size=7, padding="same", strides=2, activation="relu"
        ),
        layers.Dropout(rate=0.2),
        layers.Conv1D(
            filters=16, kernel_size=7, padding="same", strides=2, activation="relu"
        ),
        layers.Conv1DTranspose(
            filters=16, kernel_size=7, padding="same", strides=2, activation="relu"
        ),
        layers.Dropout(rate=0.2),
        layers.Conv1DTranspose(
            filters=32, kernel_size=7, padding="same", strides=2, activation="relu"
        ),
        layers.Conv1DTranspose(filters=1, kernel_size=7, padding="same"),
    ]
)
model.compile(optimizer=keras.optimizers.Adam(learning_rate=0.001), loss="mse")
model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
conv1d (Conv1D)              (None, 144, 32)           256       
_________________________________________________________________
dropout (Dropout)            (None, 144, 32)           0         
_________________________________________________________________
conv1d_1 (Conv1D)            (None, 72, 16)            3600      
_________________________________________________________________
conv1d_transpose (Conv1DTran (None, 144, 16)           1808      
_________________________________________________________________
dropout_1 (Dropout)          (None, 144, 16)           0         
_________________________________________________________________
conv1d_transpose_1 (Conv1DTr (None, 288, 32)           3616      
_________________________________________________________________
conv1d_transpose_2 (Conv1DTr (None, 288, 1)            225       
=================================================================
Total params: 9,505
Trainable params: 9,505
Non-trainable params: 0
_________________________________________________________________

モデルの訓練

これは再構築モデルですので、x_train を入力とターゲットの両者に使用していることに注意してください。

history = model.fit(
    x_train,
    x_train,
    epochs=50,
    batch_size=128,
    validation_split=0.1,
    callbacks=[
        keras.callbacks.EarlyStopping(monitor="val_loss", patience=5, mode="min")
    ],
)

Epoch 1/50
27/27 [==============================] - 2s 35ms/step - loss: 0.5868 - val_loss: 0.1225
Epoch 2/50
27/27 [==============================] - 1s 29ms/step - loss: 0.0882 - val_loss: 0.0404
Epoch 3/50
27/27 [==============================] - 1s 30ms/step - loss: 0.0594 - val_loss: 0.0359
Epoch 4/50
27/27 [==============================] - 1s 29ms/step - loss: 0.0486 - val_loss: 0.0287
Epoch 5/50
27/27 [==============================] - 1s 30ms/step - loss: 0.0398 - val_loss: 0.0231
Epoch 6/50
27/27 [==============================] - 1s 31ms/step - loss: 0.0337 - val_loss: 0.0208
Epoch 7/50
27/27 [==============================] - 1s 31ms/step - loss: 0.0299 - val_loss: 0.0182
Epoch 8/50
27/27 [==============================] - 1s 31ms/step - loss: 0.0271 - val_loss: 0.0187
Epoch 9/50
27/27 [==============================] - 1s 32ms/step - loss: 0.0251 - val_loss: 0.0190
Epoch 10/50
27/27 [==============================] - 1s 31ms/step - loss: 0.0235 - val_loss: 0.0179
Epoch 11/50
27/27 [==============================] - 1s 32ms/step - loss: 0.0224 - val_loss: 0.0189
Epoch 12/50
27/27 [==============================] - 1s 33ms/step - loss: 0.0214 - val_loss: 0.0199
Epoch 13/50
27/27 [==============================] - 1s 33ms/step - loss: 0.0206 - val_loss: 0.0194
Epoch 14/50
27/27 [==============================] - 1s 32ms/step - loss: 0.0199 - val_loss: 0.0208
Epoch 15/50
27/27 [==============================] - 1s 35ms/step - loss: 0.0192 - val_loss: 0.0204

訓練がどのように進んだかを確認するために訓練と検証損失をプロットしましょう。

plt.plot(history.history["loss"], label="Training Loss")
plt.plot(history.history["val_loss"], label="Validation Loss")
plt.legend()
plt.show()

異常の検出

モデルが入力データをどのくらい上手く再構築できるかを判定することで異常を検出します。

訓練サンプルで MAE 損失を探求します。
max MAE 損失値を見つけます。これはサンプルを再構築しようとしたときにモデルが遂行した最悪の値です。これを異常検出に対する閾値にします。
サンプルに対する再構築損失がこの閾値よりも大きければ、モデルは馴染みのないパターンを見ていると推測できます。このサンプルを異常としてラベル付けします。

# Get train MAE loss.
x_train_pred = model.predict(x_train)
train_mae_loss = np.mean(np.abs(x_train_pred - x_train), axis=1)

plt.hist(train_mae_loss, bins=50)
plt.xlabel("Train MAE loss")
plt.ylabel("No of samples")
plt.show()

# Get reconstruction loss threshold.
threshold = np.max(train_mae_loss)
print("Reconstruction error threshold: ", threshold)

Reconstruction error threshold:  0.1195600905852785

再構築の比較

Just for fun, モデルが最初のサンプルをどのように再構築したかを見ましょう。これは訓練データセットの day 1 からの 288 時間ステップです :

# Checking how the first sequence is learnt
plt.plot(x_train[0])
plt.plot(x_train_pred[0])
plt.show()

テストデータの準備

df_test_value = (df_daily_jumpsup - training_mean) / training_std
fig, ax = plt.subplots()
df_test_value.plot(legend=False, ax=ax)
plt.show()

# Create sequences from test values.
x_test = create_sequences(df_test_value.values)
print("Test input shape: ", x_test.shape)

# Get test MAE loss.
x_test_pred = model.predict(x_test)
test_mae_loss = np.mean(np.abs(x_test_pred - x_test), axis=1)
test_mae_loss = test_mae_loss.reshape((-1))

plt.hist(test_mae_loss, bins=50)
plt.xlabel("test MAE loss")
plt.ylabel("No of samples")
plt.show()

# Detect all the samples which are anomalies.
anomalies = test_mae_loss > threshold
print("Number of anomaly samples: ", np.sum(anomalies))
print("Indices of anomaly samples: ", np.where(anomalies))

Test input shape:  (3745, 288, 1)

Number of anomaly samples:  399
Indices of anomaly samples:  (array([ 789, 1653, 1654, 1941, 2697, 2702, 2703, 2704, 2705, 2706, 2707,
       2708, 2709, 2710, 2711, 2712, 2713, 2714, 2715, 2716, 2717, 2718,
       2719, 2720, 2721, 2722, 2723, 2724, 2725, 2726, 2727, 2728, 2729,
       2730, 2731, 2732, 2733, 2734, 2735, 2736, 2737, 2738, 2739, 2740,
       2741, 2742, 2743, 2744, 2745, 2746, 2747, 2748, 2749, 2750, 2751,
       2752, 2753, 2754, 2755, 2756, 2757, 2758, 2759, 2760, 2761, 2762,
       2763, 2764, 2765, 2766, 2767, 2768, 2769, 2770, 2771, 2772, 2773,
       2774, 2775, 2776, 2777, 2778, 2779, 2780, 2781, 2782, 2783, 2784,
       2785, 2786, 2787, 2788, 2789, 2790, 2791, 2792, 2793, 2794, 2795,
       2796, 2797, 2798, 2799, 2800, 2801, 2802, 2803, 2804, 2805, 2806,
       2807, 2808, 2809, 2810, 2811, 2812, 2813, 2814, 2815, 2816, 2817,
       2818, 2819, 2820, 2821, 2822, 2823, 2824, 2825, 2826, 2827, 2828,
       2829, 2830, 2831, 2832, 2833, 2834, 2835, 2836, 2837, 2838, 2839,
       2840, 2841, 2842, 2843, 2844, 2845, 2846, 2847, 2848, 2849, 2850,
       2851, 2852, 2853, 2854, 2855, 2856, 2857, 2858, 2859, 2860, 2861,
       2862, 2863, 2864, 2865, 2866, 2867, 2868, 2869, 2870, 2871, 2872,
       2873, 2874, 2875, 2876, 2877, 2878, 2879, 2880, 2881, 2882, 2883,
       2884, 2885, 2886, 2887, 2888, 2889, 2890, 2891, 2892, 2893, 2894,
       2895, 2896, 2897, 2898, 2899, 2900, 2901, 2902, 2903, 2904, 2905,
       2906, 2907, 2908, 2909, 2910, 2911, 2912, 2913, 2914, 2915, 2916,
       2917, 2918, 2919, 2920, 2921, 2922, 2923, 2924, 2925, 2926, 2927,
       2928, 2929, 2930, 2931, 2932, 2933, 2934, 2935, 2936, 2937, 2938,
       2939, 2940, 2941, 2942, 2943, 2944, 2945, 2946, 2947, 2948, 2949,
       2950, 2951, 2952, 2953, 2954, 2955, 2956, 2957, 2958, 2959, 2960,
       2961, 2962, 2963, 2964, 2965, 2966, 2967, 2968, 2969, 2970, 2971,
       2972, 2973, 2974, 2975, 2976, 2977, 2978, 2979, 2980, 2981, 2982,
       2983, 2984, 2985, 2986, 2987, 2988, 2989, 2990, 2991, 2992, 2993,
       2994, 2995, 2996, 2997, 2998, 2999, 3000, 3001, 3002, 3003, 3004,
       3005, 3006, 3007, 3008, 3009, 3010, 3011, 3012, 3013, 3014, 3015,
       3016, 3017, 3018, 3019, 3020, 3021, 3022, 3023, 3024, 3025, 3026,
       3027, 3028, 3029, 3030, 3031, 3032, 3033, 3034, 3035, 3036, 3037,
       3038, 3039, 3040, 3041, 3042, 3043, 3044, 3045, 3046, 3047, 3048,
       3049, 3050, 3051, 3052, 3053, 3054, 3055, 3056, 3057, 3058, 3059,
       3060, 3061, 3062, 3063, 3064, 3065, 3066, 3067, 3068, 3069, 3070,
       3071, 3072, 3073, 3074, 3075, 3076, 3077, 3078, 3079, 3080, 3081,
       3082, 3083, 3084, 3085, 3086, 3087, 3088, 3089, 3090, 3091, 3092,
       3093, 3094, 3095]),)

異常のプロット

今は異常であるデータのサンプルを知りました。これにより、元のテストデータから対応するタイムスタンプを見つけます。それを行うために次の方法を使用していきます :

time_steps = 3 で 10 の訓練値を持つものとします。x_train はこのようなものです :

0, 1, 2
1, 2, 3
2, 3, 4
3, 4, 5
4, 5, 6
5, 6, 7
6, 7, 8
7, 8, 9

イニシャルと最後の time_steps-1 データ値以外の総てはサンプルの time_steps 数に現れます。従って、サンプル [(3, 4, 5), (4, 5, 6), (5, 6, 7)] が異常であることを知っていれば、データポイント 5 は異常であると言えます。

# data i is an anomaly if samples [(i - timesteps + 1) to (i)] are anomalies
anomalous_data_indices = []
for data_idx in range(TIME_STEPS - 1, len(df_test_value) - TIME_STEPS + 1):
    if np.all(anomalies[data_idx - TIME_STEPS + 1 : data_idx]):
        anomalous_data_indices.append(data_idx)

異常を元のテストデータ・プロットに重ね合わせてみましょう。

df_subset = df_daily_jumpsup.iloc[anomalous_data_indices]
fig, ax = plt.subplots()
df_daily_jumpsup.plot(legend=False, ax=ax)
df_subset.plot(legend=False, ax=ax, color="r")
plt.show()

以上

2022年6月
月	火	水	木	金	土	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30