TensorFlow Hub : イントロダクションとインストール (翻訳/解説)
翻訳 : (株)クラスキャット セールスインフォメーション
作成日時 : 04/04/2018
* 本ページは、TensorFlow の本家サイトの TensorFlow Hub – Introduction 及び Installation を翻訳した上で
適宜、補足説明したものです:
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。
機械学習モデルの再利用可能なパーツの公開、発見そして消費 (= consumption) を促進するためのライブラリです。モジュールは TensorFlow グラフの自己充足的なピースで、その重みとアセットを伴い、転移学習として知られるプロセスにおいて異なるタスクに渡り再利用可能です。
モジュールは巨大なデータセットを使用したタスクのために事前訓練された変数を含みます。関連するタスク上でモジュールを再利用することにより、貴方は以下が可能になります :
- より小さなデータセットでモデルを訓練する、
- 一般化をより良いものにする、あるいは
- 訓練を本質的にスピードアップする。
文字列の配列をそれらの埋め込みにマップする英語の埋め込みモジュールを使用するサンプルがここにあります :
import tensorflow as tf import tensorflow_hub as hub with tf.Graph().as_default(): embed = hub.Module("https://tfhub.dev/google/nnlm-en-dim128-with-normalization/1") embeddings = embed(["A long sentence.", "single-word", "http://example.com"]) with tf.Session() as sess: sess.run(tf.global_variables_initializer()) sess.run(tf.tables_initializer()) print(sess.run(embeddings))
Getting Started
(訳注 : 以下のドキュメントについては順次翻訳予定です。)
- インストール (訳注 : 後述)
- チュートリアル :
- キー・コンセプト :
- モジュール :
- 利用可能なモジュール — quick links: 画像, テキスト, その他
- モジュールのための一般的なシグネチャ
追加情報
公正 (= Fairness)
総ての機械学習におけるように、公正 は 重要な 考慮すべき事柄です。モジュールは典型的には巨大な事前訓練されたデータセットを活用します。そのようなデータセットを再利用するとき、それがどのようなデータを含むか (そしてそこに存在するバイアスがあるか否か)、そしてこれらが貴方のダウンストリーム実験にインパクトをどのように与えるかについてに気を配ることは重要です。
ステータス
私達はブレーキングチェンジを回避することを望みますが、このプロジェクトはまだアクティブな開発下にありステーブルな API やモジュール・フォーマットを持つことはまだ保証されません。
セキュリティ
それらは任意の TensorFlow グラフを含みますので、モジュールはプログラムとして考えることができます。Using TensorFlow Securely は信頼されないソースからのモジュール参照のセキュリティの影響 (= implications) を記述しています。
インストール
TensorFlow Hub は 1.7 より前の TensorFlow リリースには存在しないバグ修正と拡張に依拠します。TensorFlow Hub を利用するためには少なくとも 1.7 に TensorFlow パッケージをインストールまたはアップグレードしなければなりません :
$ pip install "tensorflow>=1.7.0" $ pip install tensorflow-hub
以上