TensorFlow 1.6.0 リリースノート(翻訳)
翻訳 : (株)クラスキャット セールスインフォメーション
日時 : 03/01/2018
* 本ページは、github TensorFlow の releases の TensorFlow 1.6.0 を翻訳したものです:
互換性に影響する変更
- 事前ビルドされたバイナリは CUDA 9 と cuDNN 7 に対してビルドされています。
(訳注 : 1.5 から変更はありません。) - 事前ビルドされたバイナリは AVX 命令を使用します。これはより古い CPU 上での TF を壊すかもしれません。
(訳注: これは 1.5 のリリースノートで予告されていました。 )
主要な特徴と改良
- non-slot variable のための新しい Optimizer 内部 API。_beta[12]_power にアクセスする AdamOptimizer の descendant は更新される必要があります。
- tf.estimator.{FinalExporter,LatestExporter} は今では stripped SavedModel をエクスポートします。これは SavedModel の前方互換性を改善します。
- FFT サポートが XLA CPU/GPU に追加されました。
- Android TF は今では Tegra 互換デバイス上の CUDA アクセラレーションで構築可能です (更なる情報のためには contrib/makefile/README.md を見てください)。
バグ修正とその他の変更
- ドキュメント更新:
- Getting Started の2番目のバージョンを追加しました、これは ML の新人をターゲットにしています。
- resize_images.align_corners パラメータについてのドキュメントの明確化。
- TPU のための追加ドキュメント。
- Google Cloud Storage (GCS):
- クライアント側 throttle を追加。
- GcsFileSystem のための実装とともに、FileSystem インターフェイスに FlushCaches() メソッドを追加。
- その他:
- tf.contrib.distributions.Kumaraswamy を追加。
- RetryingFileSystem::FlushCaches() はベース FileSystem の FlushCaches() を呼び出します。
- distributions に auto_correlation を追加。
- tf.contrib.distributions.Autoregressive を追加。
- SeparableConv1D 層を追加。
- 畳み込み Flipout 層を追加。
- tf.matmul の両者の入力が bfloat16 であるとき、それは float32 の代わりに、bfloat16 を返します。
- tf.contrib.image.connected_components を追加。
- atomic variable アクセスを許す tf.contrib.framework.CriticalSection を追加。
- 分類タスクに対する木予測 (= trees predictions) に渡る出力分散 (= variance)。
- pt と eval コマンドについて、テンソル値をファイルシステムに numpy ファイルとして書くことを可能にします。
- gRPC: (gRPC 内部エラーを返す代わりに) 切断 (= truncated) エラーを伝播します。
- prefetching の2種をサポートするために parallel_interleave を拡張。
- C64-関連 ops log, pow, atan2, tanh に対する XLA サポートの改良。
- 確率的畳み込み (= probabilistic convolutional) 層の追加。
API 変更
- 後方互換正のためにデフォルト設定 False で prepare_variance boolean を導入。
- ayers_dense_variational_impl.py を layers_dense_variational.py に移動。
既知のバグ
- CUDA 9 か CUDA 9.1 と共に XLA:GPU を使用するとガベージ (= garbage) な結果そして/あるいは CUDA_ILLEGAL_ADDRESS 失敗という結果になります。
Google は December 2017 中旬に CUDA 9 と CUDA 9.1 の PTX-to-SASS コンパイラが巨大なオフセット (e.g. load [x + large_constant]) を持つ 64-bit アドレス計算を SASS における 32-bit 計算に分解するときにキャリービットを時々正しく計算しないことを発見しました。
結果的に、これらのバージョンの ptxas は 4GB 以上の一時メモリを使用する殆どの XLA プログラムをミスコンパイルします。これはガベージ結果 and/or CUDA_ERROR_ILLEGAL_ADDRESS 失敗という結果になります。
February 2018 終盤の CUDA 9.1.121 における修正が期待されます。私達は CUDA 9.0.x のための修正は期待していません。修正が利用可能になるまでは、唯一のワークアラウンドは CUDA 8.0.x に ダウングレード するか XLA:GPU を無効にすることです。
CUDA の既知の問題となるバージョンで XLA:GPU を使用する場合には TensorFlow は警告を出力します ; e00ba24 を見てください。
- ある種のアップグレードのフローの後、tensorboard コマンドかモジュールが欠落しているように見えるかもしれません。これは TensorBoard パッケージ名を変更した結果として pip パッケージが矛盾を起こすためです。修正のためには TensorBoard 1.6.0 リリースノート を見てください。
以上