TensorFlow の LSTM / GRU / bidirectional RNN で IMDb 消費者感情分析
IMDb & LSTM
消費者感情分析という用語が定着しているか分かりませんが、sentiment analysis を意訳したつもりです。IMDb は Internet Movie Database の略です。
LSTM による IMDb を利用した sentiment 分析は元々は Theano のチュートリアルで扱われたものですが :
TensorFlow で実装してみました。やることは単純で movie review の評価を positive か negative か二値分類するだけなのですが、LSTM だけでなく GRU と bidirectional RNN でも試してみました。
TensorFlow で実装/訓練
モデルは試行錯誤しましたが、最終的に次のようなモデルを利用しました。
以下は GRU の図ですが LSTM でも同様です :
それから bidirectional RNN :
訓練は 40 epochs 行ないました。GRU の収束が速いですが LSTM の曲線の方が滑らかですね :
validation 精度は 85 % 前後になりましたが、bidirectional-RNN については 80% 強が上限でした :
bidirectional-RNN の結果については optimizer やモデルをいじってもあまり変わりませんでしたので、より適合するテーマを見つけた方が良さそうです。
以上