OpenAI platform 1.x : Get Started : イントロダクション (翻訳/解説)
翻訳 : クラスキャット セールスインフォメーション
作成日時 : 11/11/2023 (v1.2.3)
* 本ページは、以下のドキュメントを翻訳した上で適宜、補足説明したものです:
* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。
- 人工知能研究開発支援
- 人工知能研修サービス(経営者層向けオンサイト研修)
- テクニカルコンサルティングサービス
- 実証実験(プロトタイプ構築)
- アプリケーションへの実装
- 人工知能研修サービス
- PoC(概念実証)を失敗させないための支援
- お住まいの地域に関係なく Web ブラウザからご参加頂けます。事前登録 が必要ですのでご注意ください。
◆ お問合せ : 本件に関するお問い合わせ先は下記までお願いいたします。
- クラスキャット セールス・マーケティング本部 セールス・インフォメーション
- sales-info@classcat.com ; Website: www.classcat.com ; ClassCatJP
OpenAI platform 1.x : Get Started : イントロダクション
概要
OpenAI API は事実上任意のタスクに対して適用できます。私たちは様々な機能と価格帯を持つ広範囲の モデル に加えてカスタムモデルを 微調整する 機能を提供しています。
リソース
- playground における実験
- API リファレンス を読む
- ヘルプセンター にアクセスする
- 現在の API ステータス を見る
- OpenAI 開発者フォーラム を確認する
- 利用ポリシー について学習する
At OpenAI, protecting user data is fundamental to our mission. We do not train our models on inputs and outputs through our API. Learn more on our API data privacy page.
主要コンセプト
テキスト生成モデル
GPT-4 や GPT-3.5 のような OpenAI のテキスト生成モデル (生成的事前訓練済み transformer 略して “GPT” モデルと呼ばれる場合も多いです) は自然言語と形式言語を理解するように訓練されました。GPT-4 のようなモデルはそれらの入力へのレスポンスでテキスト出力を提供します。これらのモデルへの入力はまた「プロンプト」とも呼ばれます。プロンプトの設計は基本的には貴方がどのように GPT-4 のようなモデルを「プログラム」するかで、通常は指示 (instructions) やどのように成功的にタスクを完遂するかの何某かの例を提供することによります。GPT-4 のようなモデルは非常に多岐に渡るタスクで使用できて、コンテンツ or コード生成、要約、会話、創造的な作文等を含みます。テキスト生成ガイド 入門と プロンプト・エンジニアリング・ガイド で詳細をお読みください。
アシスタント
アシスタントは、OpenAI API の場合は GPT-4 のような大規模言語モデルにより強化されたエンティティを指し、ユーザのタスクを遂行することができます。これらのアシスタントはモデルのコンテキスト・ウィンドウ内に埋め込まれた指示に基づいて動作します。アシスタントはまた通常、コードを実行したりファイルから情報を取得するようなより複雑なタスクを実行することを可能にするツールへのアクセスを持ちます。アシスタント API 概要 でアシスタントについて更に読んでください。
埋め込み (Embeddings)
埋め込みはデータのピース (e.g. 何某かのテキスト) のベクトル表現で、そのコンテンツ and/or その意味の諸相 (aspects) を保持することを目的としています。ある点で類似しているデータのチャンクは無関係のデータよりも近い埋め込みを一緒に持つ傾向にあります。OpenAI は、入力としてテキスト文字列を受け取り、出力として埋め込みベクトルを生成するテキスト埋め込みモデルを提供しています。埋め込みは、検索、クラスタリング、リコメンデーション、異常検出、分類等のために役立ちます。埋め込みガイド で埋め込みについて詳細をお読みください。
トークン
テキスト生成モデルと埋め込みモデルはトークンと呼ばれるチャンクでテキストを処理します。トークンは普通に存在する、文字のシークエンスを表します。例えば、文字列 ” tokenization” は ” token” と “ization” に分解されます、その一方で ” the” のような短い一般的な単語は単一トークンとして表されます。センテンス内で、各単語の最初のトークンは通常はスペースキャラクターで始まることに注意してください。特定の文字列をテストするために私たちの トークナイザーツール を確認して、それらがどのようにトークンに変換されるかをご覧ください。経験則で、英語テキストについて 1 トークンはおよそ 4 文字で、0.75 単語です。
念頭に置くべき一つの制限は、テキスト生成モデルについて連結されたプロンプトと生成出力はモデルの最大コンテキスト長以下でなければならないことです。埋め込みモデルについては (これはトークンを出力しません)、入力はモデルの最大コンテキスト長よりも短くなければなりません。各テキスト生成モデルと埋め込みモデルに対する最大コンテキスト長は モデルインデックス で見つけられます。
ガイド
Jump into one of our guides to learn more.
- クイックスタート・チュートリアル – 簡単なサンプルアプリケーションを構築して学習
- テキスト生成 – テキストを生成して処理する方法の学習
- アシスタント (Beta) – アシスタントの構築の基本の学習
- 埋め込み – テキストを検索、分類、そして比較する方法の学習
- 発話-to-テキスト変換 – 発話をテキストに変換する方法の学習
- 画像生成 – 画像を生成したり編集する方法の学習
- ビジョン – GPT-4 を使用して画像を処理する方法の学習
以上