Skip to content

ClasCat® AI Research

クラスキャット – 生成 AI, AI エージェント, MCP

Menu
  • ホーム
    • ClassCat® AI Research ホーム
    • クラスキャット・ホーム
  • OpenAI API
    • OpenAI Python ライブラリ 1.x : 概要
    • OpenAI ブログ
      • GPT の紹介
      • GPT ストアの紹介
      • ChatGPT Team の紹介
    • OpenAI platform 1.x
      • Get Started : イントロダクション
      • Get Started : クイックスタート (Python)
      • Get Started : クイックスタート (Node.js)
      • Get Started : モデル
      • 機能 : 埋め込み
      • 機能 : 埋め込み (ユースケース)
      • ChatGPT : アクション – イントロダクション
      • ChatGPT : アクション – Getting started
      • ChatGPT : アクション – アクション認証
    • OpenAI ヘルプ : ChatGPT
      • ChatGPTとは何ですか?
      • ChatGPT は真実を語っていますか?
      • GPT の作成
      • GPT FAQ
      • GPT vs アシスタント
      • GPT ビルダー
    • OpenAI ヘルプ : ChatGPT > メモリ
      • FAQ
    • OpenAI ヘルプ : GPT ストア
      • 貴方の GPT をフィーチャーする
    • OpenAI Python ライブラリ 0.27 : 概要
    • OpenAI platform
      • Get Started : イントロダクション
      • Get Started : クイックスタート
      • Get Started : モデル
      • ガイド : GPT モデル
      • ガイド : 画像生成 (DALL·E)
      • ガイド : GPT-3.5 Turbo 対応 微調整
      • ガイド : 微調整 1.イントロダクション
      • ガイド : 微調整 2. データセットの準備 / ケーススタディ
      • ガイド : 埋め込み
      • ガイド : 音声テキスト変換
      • ガイド : モデレーション
      • ChatGPT プラグイン : イントロダクション
    • OpenAI Cookbook
      • 概要
      • API 使用方法 : レート制限の操作
      • API 使用方法 : tiktoken でトークンを数える方法
      • GPT : ChatGPT モデルへの入力をフォーマットする方法
      • GPT : 補完をストリームする方法
      • GPT : 大規模言語モデルを扱う方法
      • 埋め込み : 埋め込みの取得
      • GPT-3 の微調整 : 分類サンプルの微調整
      • DALL-E : DALL·E で 画像を生成して編集する方法
      • DALL·E と Segment Anything で動的マスクを作成する方法
      • Whisper プロンプティング・ガイド
  • Gemini API
    • Tutorials : クイックスタート with Python (1) テキスト-to-テキスト生成
    • (2) マルチモーダル入力 / 日本語チャット
    • (3) 埋め込みの使用
    • (4) 高度なユースケース
    • クイックスタート with Node.js
    • クイックスタート with Dart or Flutter (1) 日本語動作確認
    • Gemma
      • 概要 (README)
      • Tutorials : サンプリング
      • Tutorials : KerasNLP による Getting Started
  • Keras 3
    • 新しいマルチバックエンド Keras
    • Keras 3 について
    • Getting Started : エンジニアのための Keras 入門
    • Google Colab 上のインストールと Stable Diffusion デモ
    • コンピュータビジョン – ゼロからの画像分類
    • コンピュータビジョン – 単純な MNIST convnet
    • コンピュータビジョン – EfficientNet を使用した微調整による画像分類
    • コンピュータビジョン – Vision Transformer による画像分類
    • コンピュータビジョン – 最新の MLPモデルによる画像分類
    • コンピュータビジョン – コンパクトな畳込み Transformer
    • Keras Core
      • Keras Core 0.1
        • 新しいマルチバックエンド Keras (README)
        • Keras for TensorFlow, JAX, & PyTorch
        • 開発者ガイド : Getting started with Keras Core
        • 開発者ガイド : 関数型 API
        • 開発者ガイド : シーケンシャル・モデル
        • 開発者ガイド : サブクラス化で新しい層とモデルを作成する
        • 開発者ガイド : 独自のコールバックを書く
      • Keras Core 0.1.1 & 0.1.2 : リリースノート
      • 開発者ガイド
      • Code examples
      • Keras Stable Diffusion
        • 概要
        • 基本的な使い方 (テキスト-to-画像 / 画像-to-画像変換)
        • 混合精度のパフォーマンス
        • インペインティングの簡易アプリケーション
        • (参考) KerasCV – Stable Diffusion を使用した高性能画像生成
  • TensorFlow
    • TF 2 : 初級チュートリアル
    • TF 2 : 上級チュートリアル
    • TF 2 : ガイド
    • TF 1 : チュートリアル
    • TF 1 : ガイド
  • その他
    • 🦜️🔗 LangChain ドキュメント / ユースケース
    • Stable Diffusion WebUI
      • Google Colab で Stable Diffusion WebUI 入門
      • HuggingFace モデル / VAE の導入
      • LoRA の利用
    • Diffusion Models / 拡散モデル
  • クラスキャット
    • 会社案内
    • お問合せ
    • Facebook
    • ClassCat® Blog
Menu

OpenAI Cookbook : GPT : 大規模言語モデルを扱う方法

Posted on 08/04/202308/04/2023 by Sales Information

OpenAI Cookbook examples : GPT : 大規模言語モデルを扱う方法 (翻訳/解説)

翻訳 : (株)クラスキャット セールスインフォメーション
作成日時 : 08/04/2023

* 本ページは、OpenAI Cookbook レポジトリの以下のドキュメントを翻訳した上で適宜、補足説明したものです:

  • examples : GPT : Guide : How to work with large language models

* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。

 

クラスキャット 人工知能 研究開発支援サービス

◆ クラスキャット は人工知能・テレワークに関する各種サービスを提供しています。お気軽にご相談ください :

  • 人工知能研究開発支援
    1. 人工知能研修サービス(経営者層向けオンサイト研修)
    2. テクニカルコンサルティングサービス
    3. 実証実験(プロトタイプ構築)
    4. アプリケーションへの実装

  • 人工知能研修サービス

  • PoC(概念実証)を失敗させないための支援
◆ 人工知能とビジネスをテーマに WEB セミナーを定期的に開催しています。スケジュール。
  • お住まいの地域に関係なく Web ブラウザからご参加頂けます。事前登録 が必要ですのでご注意ください。

◆ お問合せ : 本件に関するお問い合わせ先は下記までお願いいたします。

  • 株式会社クラスキャット セールス・マーケティング本部 セールス・インフォメーション
  • sales-info@classcat.com  ;  Web: www.classcat.com  ;   ClassCatJP

 

OpenAI Cookbook : GPT : 大規模言語モデルを扱う方法

大規模言語モデルはどのように動作するか

大規模言語モデル はテキストをテキストにマップする関数です。テキストの入力文字列が与えられたとき、大規模言語モデルは次にくるべきテキストを予測します。

大規模言語モデルのマジックは、膨大な量のテキストに対してこの予測誤差を最小化するように訓練されることで、モデルは最終的にこれらの予測に対して有用なコンセプトを学習できることです。例えば、モデルは以下を学習します :

  • 字の綴り方 (how to spell)
  • 文法が機能する仕組み
  • 言い換えの方法
  • 質問への答え方
  • 会話の方法
  • 多くの言語で書く方法
  • コーディングする方法
  • 等々

これらの機能は明示的にプログラムで組み込まれたものではありません — それらはすべて訓練の結果として現れます。

GPT-3 は生産性 (向上) アプリ、教育アプリ、ゲーム等を含む、数百のソフトウェア製品 を支援しています。

 

大規模言語モデルを制御する方法

大規模言語モデルへのすべての入力の中で、圧倒的に最も影響力のあるものはテキストプロンプトです。

大規模言語モデルは幾つかの方法で出力を生成するように prompt できます :

  • インストラクション (Instruction) : モデルに貴方が望むものを伝えます。
  • 補完 (Completion) : 貴方が望むものの開始部分を補完するようにモデルを誘導します。
  • デモ (Demonstration) : 以下のいずれかの方法で、モデルに貴方が望むものを示します :
    • プロンプト内の幾つかのサンプル
    • 微調整訓練データセットで数百か数千のサンプル

An example of each is shown below.

 

インストラクション (指示)・プロンプト

インストラクション-following モデル (e.g., text-davinci-003 や text- で始まるモデル) は指示に従うように特に設計されています。プロンプトの最初 (または最後、あるいは両方) に貴方の指示を書くとモデルは指示に従うようにベストを尽くしてから停止します。手順は詳述できますので、貴方が望む出力を明示的に詳述するパラグラフを書くことを恐れる必要はありません。

Example instruction prompt:

Extract the name of the author from the quotation below.

“Some humans theorize that intelligent species go extinct before they can expand into outer space. If they're correct, then the hush of the night sky is the silence of the graveyard.”
― Ted Chiang, Exhalation

Output:

Ted Chiang

 

補完プロンプト例

補完スタイルプロンプトは、大規模言語モデルが次にくる可能性が最も高いと考えるテキストを書こうとする方法を利用します。モデルを操縦する (steer, 導く) には、貴方が見たい出力により補完されるパターンやセンテンスを始めてみてください。直接的な指示と比較して、大規模言語モデルを操縦するこのモードはより注意深くそしてより多くの実験を行なうことができます。更に、モデルはどこで停止するべきか必ずしも知りませんので、望まれる出力を超えて生成されるテキストを切り捨てるために停止シークエンスか後処理が必要な場合が多いでしょう。

Example completion prompt:

“Some humans theorize that intelligent species go extinct before they can expand into outer space. If they're correct, then the hush of the night sky is the silence of the graveyard.”
― Ted Chiang, Exhalation

The author of this quote is

Output:

 Ted Chiang

 

デモプロンプト例 (few-shot 学習)

補完スタイルのプロンプトと同様に、デモはモデルに貴方がそれに何を行なうことを望むかを示すことができます。このアプローチは few-shot 学習と呼ばれる場合があります、モデルがプロンプトで提供される幾つかのサンプルから学習するからです。

Example demonstration prompt:

Quote:
“When the reasoning mind is forced to confront the impossible again and again, it has no choice but to adapt.”
― N.K. Jemisin, The Fifth Season
Author: N.K. Jemisin

Quote:
“Some humans theorize that intelligent species go extinct before they can expand into outer space. If they're correct, then the hush of the night sky is the silence of the graveyard.”
― Ted Chiang, Exhalation
Author:

Output:

Ted Chiang

 

微調整済みプロンプトの例

十分な訓練サンプルにより、カスタムモデルを微調整することができます。この場合、指示は不要になります、モデルは提供された訓練データからタスクを学習できるからです。ただし、プロンプトがいつ終わるのか、出力がいつ始まるべきかをモデルに伝えるために、区切り文字シークエンス (e.g., -> か ###、または一般に入力に現れない任意の文字列) を含めることは役立つ可能性があります。区切り文字シークエンスがないと、貴方が見たい答えから始めるのではなく、入力テキストから詳述し続けるリスクがあります。

微調整されたプロンプトの例 (類似したプロンプト-補完ペア上でカスタム訓練されたモデルに対して) :

“Some humans theorize that intelligent species go extinct before they can expand into outer space. If they're correct, then the hush of the night sky is the silence of the graveyard.”
― Ted Chiang, Exhalation

###

Output:

Ted Chiang

 

コーディング機能

大規模言語モデルはテキストにおいて優れているだけではありません – コーディングにおいてもです。OpenAI の専用コーディングモデルは Codex と呼ばれます。

Codex は 70 以上の製品 を支援しています、以下を含みます :

  • GitHub Copilot (VS Code と他の IDE の自動補完)

  • Pygma (Figma のデザインをコードに変換します)

  • Replit (‘Explain code’ ボタンと他の機能を持ちます)

  • Warp (AI コマンド検索を持つスマート端末)

  • Machinet (Java ユニットテスト・テンプレートの作成)

インストラクション-following テキストモデル (e.g., text-davinci-002) と違い、Codex は指示に従うようには訓練されていないことに注意してください。その結果、良いプロンプトの設計はより注意を払うことができます。

 

より多くのプロンプト・アドバイス

より多くのプロンプトのサンプルについては、OpenAI サンプル にアクセスしてください。

一般に、入力プロンプトはモデル出力の改良のために最良の手段です。以下のようなトリックを試すことができます :

  • より多くの明確な指示を与える。例えば、出力がカンマ区切りリストであることを望む場合、カンマ区切りリストを返すように要求します。答えを知らないとき “I don’t know” と言わせたい場合、’Say “I don’t know” if you do not know the answer.’ と伝えてください。

  • よりよい例を提供する。プロンプトで例を示している場合、貴方の例が多様で高品質であることを確認してください。

  • モデルに専門家であるかのように回答することを要求する。モデルに高品質な出力か、専門家により書かれたかのような出力を生成することを明示的に要求すれば、モデルが (専門家が書いたと考えるような) より高い品質の回答を与えるように誘導することができます。例えば、”The following answer is correct, high-quality, and written by an expert.”

  • モデルにその推論を説明するステップの系列を書き下すようにプロンプトを与える。例えば、回答の前に “Let’s think step by step.” のようなものを追加します。最終的な回答の前にモデルに推論の説明を促すことで、最終的な答えが一貫していて正しい尤度を高めることができます。

 

以上



クラスキャット

最近の投稿

  • LangGraph Platform : 概要
  • LangGraph : Prebuilt エージェント : ユーザインターフェイス
  • LangGraph : Prebuilt エージェント : 配備
  • LangGraph : Prebuilt エージェント : マルチエージェント
  • LangGraph : Prebuilt エージェント : メモリ

タグ

AutoGen (13) ClassCat Press Release (20) ClassCat TF/ONNX Hub (11) DGL 0.5 (14) Eager Execution (7) Edward (17) FLUX.1 (16) Gemini (20) HuggingFace Transformers 4.5 (10) HuggingFace Transformers 4.6 (7) HuggingFace Transformers 4.29 (9) Keras 2 Examples (98) Keras 2 Guide (16) Keras 3 (10) Keras Release Note (17) Kubeflow 1.0 (10) LangChain (45) LangGraph (19) MediaPipe 0.8 (11) Model Context Protocol (16) NNI 1.5 (16) OpenAI Agents SDK (8) OpenAI Cookbook (13) OpenAI platform (10) OpenAI platform 1.x (10) OpenAI ヘルプ (8) TensorFlow 2.0 Advanced Tutorials (33) TensorFlow 2.0 Advanced Tutorials (Alpha) (15) TensorFlow 2.0 Advanced Tutorials (Beta) (16) TensorFlow 2.0 Guide (10) TensorFlow 2.0 Guide (Alpha) (16) TensorFlow 2.0 Guide (Beta) (9) TensorFlow 2.0 Release Note (12) TensorFlow 2.0 Tutorials (20) TensorFlow 2.0 Tutorials (Alpha) (14) TensorFlow 2.0 Tutorials (Beta) (12) TensorFlow 2.4 Guide (24) TensorFlow Deploy (8) TensorFlow Get Started (7) TensorFlow Graphics (7) TensorFlow Probability (9) TensorFlow Programmer's Guide (22) TensorFlow Release Note (18) TensorFlow Tutorials (33) TF-Agents 0.4 (11)
2023年8月
月 火 水 木 金 土 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 7月   9月 »
© 2025 ClasCat® AI Research | Powered by Minimalist Blog WordPress Theme