Skip to content

ClasCat® AI Research

クラスキャット – 生成 AI, AI エージェント, MCP

Menu
  • ホーム
    • ClassCat® AI Research ホーム
    • クラスキャット・ホーム
  • OpenAI API
    • OpenAI Python ライブラリ 1.x : 概要
    • OpenAI ブログ
      • GPT の紹介
      • GPT ストアの紹介
      • ChatGPT Team の紹介
    • OpenAI platform 1.x
      • Get Started : イントロダクション
      • Get Started : クイックスタート (Python)
      • Get Started : クイックスタート (Node.js)
      • Get Started : モデル
      • 機能 : 埋め込み
      • 機能 : 埋め込み (ユースケース)
      • ChatGPT : アクション – イントロダクション
      • ChatGPT : アクション – Getting started
      • ChatGPT : アクション – アクション認証
    • OpenAI ヘルプ : ChatGPT
      • ChatGPTとは何ですか?
      • ChatGPT は真実を語っていますか?
      • GPT の作成
      • GPT FAQ
      • GPT vs アシスタント
      • GPT ビルダー
    • OpenAI ヘルプ : ChatGPT > メモリ
      • FAQ
    • OpenAI ヘルプ : GPT ストア
      • 貴方の GPT をフィーチャーする
    • OpenAI Python ライブラリ 0.27 : 概要
    • OpenAI platform
      • Get Started : イントロダクション
      • Get Started : クイックスタート
      • Get Started : モデル
      • ガイド : GPT モデル
      • ガイド : 画像生成 (DALL·E)
      • ガイド : GPT-3.5 Turbo 対応 微調整
      • ガイド : 微調整 1.イントロダクション
      • ガイド : 微調整 2. データセットの準備 / ケーススタディ
      • ガイド : 埋め込み
      • ガイド : 音声テキスト変換
      • ガイド : モデレーション
      • ChatGPT プラグイン : イントロダクション
    • OpenAI Cookbook
      • 概要
      • API 使用方法 : レート制限の操作
      • API 使用方法 : tiktoken でトークンを数える方法
      • GPT : ChatGPT モデルへの入力をフォーマットする方法
      • GPT : 補完をストリームする方法
      • GPT : 大規模言語モデルを扱う方法
      • 埋め込み : 埋め込みの取得
      • GPT-3 の微調整 : 分類サンプルの微調整
      • DALL-E : DALL·E で 画像を生成して編集する方法
      • DALL·E と Segment Anything で動的マスクを作成する方法
      • Whisper プロンプティング・ガイド
  • Gemini API
    • Tutorials : クイックスタート with Python (1) テキスト-to-テキスト生成
    • (2) マルチモーダル入力 / 日本語チャット
    • (3) 埋め込みの使用
    • (4) 高度なユースケース
    • クイックスタート with Node.js
    • クイックスタート with Dart or Flutter (1) 日本語動作確認
    • Gemma
      • 概要 (README)
      • Tutorials : サンプリング
      • Tutorials : KerasNLP による Getting Started
  • Keras 3
    • 新しいマルチバックエンド Keras
    • Keras 3 について
    • Getting Started : エンジニアのための Keras 入門
    • Google Colab 上のインストールと Stable Diffusion デモ
    • コンピュータビジョン – ゼロからの画像分類
    • コンピュータビジョン – 単純な MNIST convnet
    • コンピュータビジョン – EfficientNet を使用した微調整による画像分類
    • コンピュータビジョン – Vision Transformer による画像分類
    • コンピュータビジョン – 最新の MLPモデルによる画像分類
    • コンピュータビジョン – コンパクトな畳込み Transformer
    • Keras Core
      • Keras Core 0.1
        • 新しいマルチバックエンド Keras (README)
        • Keras for TensorFlow, JAX, & PyTorch
        • 開発者ガイド : Getting started with Keras Core
        • 開発者ガイド : 関数型 API
        • 開発者ガイド : シーケンシャル・モデル
        • 開発者ガイド : サブクラス化で新しい層とモデルを作成する
        • 開発者ガイド : 独自のコールバックを書く
      • Keras Core 0.1.1 & 0.1.2 : リリースノート
      • 開発者ガイド
      • Code examples
      • Keras Stable Diffusion
        • 概要
        • 基本的な使い方 (テキスト-to-画像 / 画像-to-画像変換)
        • 混合精度のパフォーマンス
        • インペインティングの簡易アプリケーション
        • (参考) KerasCV – Stable Diffusion を使用した高性能画像生成
  • TensorFlow
    • TF 2 : 初級チュートリアル
    • TF 2 : 上級チュートリアル
    • TF 2 : ガイド
    • TF 1 : チュートリアル
    • TF 1 : ガイド
  • その他
    • 🦜️🔗 LangChain ドキュメント / ユースケース
    • Stable Diffusion WebUI
      • Google Colab で Stable Diffusion WebUI 入門
      • HuggingFace モデル / VAE の導入
      • LoRA の利用
    • Diffusion Models / 拡散モデル
  • クラスキャット
    • 会社案内
    • お問合せ
    • Facebook
    • ClassCat® Blog
Menu

Gemini : 機能 : モデル調整へのイントロ

Posted on 05/05/202405/06/2024 by Sales Information

Gemini : 機能 : モデル調整 – モデル調整へのイントロ

作成 : クラスキャット セールスインフォメーション
作成日時 : 05/05/2024

* 本ページは、ai.google.dev の以下のページを独自に翻訳して、適宜、補足説明したものです :

  • Intro to model tuning

* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。

 

クラスキャット 人工知能 研究開発支援サービス

◆ クラスキャット は人工知能・テレワークに関する各種サービスを提供しています。お気軽にご相談ください :

ClassCat Chatbot

  • 人工知能研究開発支援
    1. 人工知能研修サービス(経営者層向けオンサイト研修)
    2. テクニカルコンサルティングサービス
    3. 実証実験(プロトタイプ構築)
    4. アプリケーションへの実装

  • 人工知能研修サービス

  • PoC(概念実証)を失敗させないための支援
◆ 人工知能とビジネスをテーマに WEB セミナーを定期的に開催しています。スケジュール。
  • お住まいの地域に関係なく Web ブラウザからご参加頂けます。事前登録 が必要ですのでご注意ください。

◆ お問合せ : 本件に関するお問い合わせ先は下記までお願いいたします。

  • クラスキャット セールス・マーケティング本部 セールス・インフォメーション
  • sales-info@classcat.com  ;  Website: www.classcat.com  ;   ClassCatJP

 

 

Gemini : 機能 : モデル調整 – モデル調整へのイントロ

few ショット・プロンプティングのようなプロンプト設計ストラテジーは必要な結果を常に生成するとは限りません。モデル調整を使用して、特定のタスクに対するモデル性能を向上させたり、指示が十分でなく、望む出力を示すサンプルのセットを持つ場合にモデルが特定の出力要件に従うのを手助けします。

このページは Gemini API テキストサービスの背後でテキストモデルを調整する上でのガイダンスを提供します。

⭐️ Note : Tuning is available for the gemini-1.0-pro-001 and text-bison-001 models.

 

モデル調整がどのように動作するか

モデル調整のゴールは、特定のタスクに対してモデル性能をさらに向上させることです。モデル調整は、モデルにタスクの多くのサンプルを含む訓練データセットを提供することで機能します。ニッチなタスクについては、モデルを少量のサンプルで調整することによりモデル性能の大幅な改良を得られます。

訓練データはプロンプト入力と期待される応答出力を含むサンプルとして構造化される必要があります。Google AI Studio でサンプルデータを直接使用してモデルを調整することもできます。ゴールは、動作やタスクを示す多くのサンプルをモデルに与えることで、モデルが望ましい動作やタスクを模倣するように教えることです。

調整ジョブを実行する場合、モデルは、望ましいタスクを実行したり望ましい動作を学習するのに必要な情報をエンコードするのに役立つ追加パラメータを学習します。そしてこれらのパラメータは推論時に使用できます。調整ジョブの出力は新しいモデルです、これは新たに学習されたパラメータと元のモデルの効果的な組み合わせです。

 

サポートされるモデル

以下の基礎モデルがモデル調整をサポートします。単一ターンのテキスト補完のみがサポートされます。

  • Gemini 1.0 Pro
  • text-bison-001

 

モデル調整のワークフロー

モデル調整のワークフローは以下のようなものです :

  1. データセットの準備。
  2. Google AI Studio を使用している場合、データセットをインポートします。
  3. 調整ジョブを開始します。

モデル調整が完了したら、調整済みモデルの名前が表示されます。新しいプロンプトを作成するときそれを使用するモデルとして Google AI Studio で選択することもできます。

 

データセットの準備

訓練を始める前に、それでモデルを調整するデータセットが必要です。最高のパフォーマンスのためには、データセットのサンプルは高品質で、多様で、実際の入力と出力の見本である必要があります。

 

形式

データセットに含まれるサンプルは想定される実運用のトラフィックに一致する必要があります。データセットが特定の形式、キーワード、指示や情報を含む場合、実運用データも同じ方法で形式化されて同じ指示を含む必要があります。

例えば、データセットのサンプルが “question:” と “context:” を含む場合、実運用のトラフィックもまた、データセットサンプルで現れるように、”question:” と”context:” を同じ順序で含むように形式化される必要があります。コンテキストを除外すると、正確な質問がデータセットのサンプルにある場合でさえ、モデルはパターンを認識できません。

データセットの各サンプルにプロンプトか前文 (preamble) を追加することは調整済みモデルの性能を改良するのに役立てることもできます。注意してください、プロンプトや前文がデータセットに含まれる場合、それはまた推論時に調整済みモデルへのプロンプトに含まれている必要があります。

 

訓練データサイズ

モデルは 20 サンプルほど少なくても調整できて、一般に追加のデータは応答の品質を向上させます。アプリケーションに応じて 100 から 500 サンプルを目標にする必要があります。次の表は様々な一般的なタスクについてテキストモデルを調整するために推奨されるデータセットサイズを示します :

タスク データセットのサンプル数
分類 100+
要約 100-500+
ドキュメント検索 100+

 

調整用データセットのアップロード

データは API を使用してインラインで渡されるか、Google AI Studio でアップロードされたファイル経由で渡されます。

Imoport ボタンを使用してファイルからデータをインポートするか、インポートする、サンプルを含む構造化プロンプトを調整用データセットとして選択します。

 
クライアント・ライブラリ

クライアントライブラリを使用するには、createTunedModel 呼び出しでデータファイルを供給します。ファイルサイズの上限は 4MB です。始めるには tuning quickstart with Python をご覧ください。

 
Curl

Curl を使用して REST API を呼び出すには、JSON 形式の訓練サンプルを training_data 引数に供給します。始めるには tuning quickstart with Curl をご覧ください。

 

高度な調整設定

調整ジョブを作成するとき、以下の高度な設定を指定することができます :

  • Epochs (エポック) – 各サンプルが一度は処理されるように、訓練セット全体に渡る完全な訓練パス。

  • バッチサイズ – 一回の訓練反復で使用されるサンプルのセット。バッチサイズはバッチのサンプル数を決定します。

  • 学習率 – 各反復でモデルパラメータをどの程度強く調整するかをアルゴリズムに伝える浮動小数点数。例えば、0.3 の学習率は 0.1 の学習率よりも 3 倍強力に重みとバイアスを調整するでしょう。高い学習率と低い学習率は独自のトレードオフがあり、ユースケースに応じて調整する必要があります。

  • 学習率の乗数 (multiplier) – 学習率の乗数はモデルの元の学習率を変更します。1 の値はモデルの元の学習率を使用します。1 より大きい値は学習率を増加させ、1 と 0 の間の値は学習率を低下させます。

 

推奨構成設定

次の表は基礎モデルを調整するために推奨される configuration を示します :

ハイパーパラメータ デフォルト値 推奨される調整
エポック 5 5 エポックの前に損失が平坦化 (plateau) し始める場合は、より小さい値を使用します。
バッチサイズ 4
学習率 0.001 小さいデータセットには小さい値を使用します。

損失曲線は、各エポック後に訓練サンプルにおいて、モデルの予測が理想的な予測からどの程度外れているかを示します。理想的には、それが平坦化するすぐ前に、曲線の最も低い点で訓練を停止するのが望ましいです。例えば、下のグラフはおよそエポック 4-6 で損失曲線が平坦化することを示しています、これはエポックパラメータを 4 に設定しても同じ性能が得られることを意味します。

 

調整ジョブスタータスの確認

調整中のジョブのステータスは Google AI Studio UI の My Library タブか、Gemini API の調整モデルのメタデータプロパティを使用して確認できます。

 

以上



クラスキャット

最近の投稿

  • Agno : コンセプト : エージェント – エージェントの実行
  • Agno : コンセプト : エージェント – 概要
  • Agno : イントロダクション : Playground / モニタリング & デバッグ
  • Agno : イントロダクション : マルチエージェント・システム
  • Agno : イントロダクション : エージェントとは ? / Colab 実行例

タグ

AutoGen (13) ClassCat Press Release (20) ClassCat TF/ONNX Hub (11) DGL 0.5 (14) Eager Execution (7) Edward (17) FLUX.1 (16) Gemini (20) HuggingFace Transformers 4.5 (10) HuggingFace Transformers 4.6 (7) HuggingFace Transformers 4.29 (9) Keras 2 Examples (98) Keras 2 Guide (16) Keras 3 (10) Keras Release Note (17) Kubeflow 1.0 (10) LangChain (45) LangGraph (24) LangGraph 0.5 (9) MediaPipe 0.8 (11) Model Context Protocol (16) NNI 1.5 (16) OpenAI Agents SDK (8) OpenAI Cookbook (13) OpenAI platform (10) OpenAI platform 1.x (10) OpenAI ヘルプ (8) TensorFlow 2.0 Advanced Tutorials (33) TensorFlow 2.0 Advanced Tutorials (Alpha) (15) TensorFlow 2.0 Advanced Tutorials (Beta) (16) TensorFlow 2.0 Guide (10) TensorFlow 2.0 Guide (Alpha) (16) TensorFlow 2.0 Guide (Beta) (9) TensorFlow 2.0 Release Note (12) TensorFlow 2.0 Tutorials (20) TensorFlow 2.0 Tutorials (Alpha) (14) TensorFlow 2.0 Tutorials (Beta) (12) TensorFlow 2.4 Guide (24) TensorFlow Deploy (8) TensorFlow Get Started (7) TensorFlow Probability (9) TensorFlow Programmer's Guide (22) TensorFlow Release Note (18) TensorFlow Tutorials (33) TF-Agents 0.4 (11)
2024年5月
月 火 水 木 金 土 日
 12345
6789101112
13141516171819
20212223242526
2728293031  
« 4月   6月 »
© 2025 ClasCat® AI Research | Powered by Minimalist Blog WordPress Theme