OpenAI platform : Get Started : モデル (翻訳/解説)
翻訳 : (株)クラスキャット セールスインフォメーション
作成日時 : 07/24/2023
* 本ページは、以下のドキュメントを翻訳した上で適宜、補足説明したものです:
* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。
- 人工知能研究開発支援
- 人工知能研修サービス(経営者層向けオンサイト研修)
- テクニカルコンサルティングサービス
- 実証実験(プロトタイプ構築)
- アプリケーションへの実装
- 人工知能研修サービス
- PoC(概念実証)を失敗させないための支援
- お住まいの地域に関係なく Web ブラウザからご参加頂けます。事前登録 が必要ですのでご注意ください。
◆ お問合せ : 本件に関するお問い合わせ先は下記までお願いいたします。
- 株式会社クラスキャット セールス・マーケティング本部 セールス・インフォメーション
- sales-info@classcat.com ; Web: www.classcat.com ; ClassCatJP
OpenAI platform : Get Started : モデル
概要
OpenAI API は様々な機能と価格帯を持つ多様なモデルのセットにより支援されています。また 微調整 により特定のユースケースに対してオリジナルのベースモデルに限定的ながらカスタマイズを行なうこともできます。
- GPT-4 – GPT-3.5 上で改良したモデルのセットで、自然言語やコードを理解して生成することができます。
- GPT-3.5 – GPT-3 上で改良したモデルのセットで、自然言語やコードを理解して生成することができます。
- DALL·E – 自然言語のプロンプトが与えられたとき画像を生成して編集できるモデルです。
- Whisper – 音声をテキストに変換できるモデル。
- Embeddings – テキストを数値形式に変換できるモデルのセット。
- Moderation – テキストが機密性が高いか安全でない可能性があるかを検出できる微調整済みモデルです。
- GPT-3 (Legacy) -自然言語を理解して生成することができるモデルのセット。
- Deprecated – deprecated にされたモデルの完全なリスト
私たちはまた Point-E, Whisper, Jukebox と CLIP を含む、オープンソースのモデルも公開しています。
研究者のためのモデルインデックス にアクセスして、研究論文でフィーチャーされているモデルや、InstructGPT と GPT-3.5 のようなモデルシリーズ間の違いについて更に学習してください。
継続的なモデルアップグレード
開発者のフィードバックに基づき、OpenAI API の gpt-3.5-turbo-0301 と gpt-4-0314 models に対するサポートを少なくとも 2024年6月13日まで延長しています。We’ve updated our June 13 blog post with more details.
gpt-3.5-turbo のリリースに伴い、モデルの一部は継続的に更新されています。また、更新モデルが導入された後、少なくとも 3 ヶ月間は開発者が利用し続けることができる静的モデルバージョンも提供します。モデル更新の新しいペースに伴い、様々なユースケースに対してモデルを改善するのに役立つように、人々が評価に貢献できるようにもしています。If you are interested, check out the OpenAI Evals repository.
以下のモデルは一時的なスナップショットですが、更新バージョンが利用可能になれば、それらの deprecation date をアナウンスします。最新のモデルバージョンを使用したい場合には、gpt-4 や gpt-3.5-turbo のような標準モデル名を使用してください。
モデル名 | DISCONTINUATION DATE | 置き換えモデル |
---|---|---|
gpt-3.5-turbo-0301 | at earliest 06/13/2024 | gpt-3.5-turbo-0613 |
gpt-4-0314 | at earliest 06/13/2024 | gpt-4-0613 |
gpt-4-32k-0314 | at earliest 06/13/2024 | gpt-4-32k-0613 |
Learn more about model deprecation on our deprecation page.
GPT-4
GPT-4 is currently accessible to those who have made at least one successful payment through our developer platform.
GPT-4 は大規模なマルチモーダル・モデル (現在はテキスト入力を受け取りテキスト出力を吐きますが、将来的には画像入力を伴います) で、広範囲な一般的な知識と高度な推論機能のおかげで、以前のどのモデルよりも素晴らしい精度で困難な問題を解くことができます。gpt-3.5-turbo のように、GPT-4 はチャット用に最適化されていますが、Chat Completions API を使用した従来の補完タスクに対しても上手く機能します。Learn how to use GPT-4 in our GPT guide.
最新モデル | 説明 | 最大トークン | 訓練データ |
---|---|---|---|
gpt-4 | どの GPT-3.5 モデルよりも能力が高く、より複雑なタスクを行なうことが可能で、チャット用に最適化されています。リリース後 2 週間周期で最新モデルにより更新されます。 | 8,192 トークン | Up to Sep 2021 |
gpt-4-0613 | 2023年6月13日からの gpt-4 のスナップショットで関数呼び出しデータを含みます。gpt-4 とは異なり、このモデルは更新を受け取らず、新しいバージョンがリリースされた後 3 ヶ月で deprecated となります。 | 8,192 トークン | Up to Sep 2021 |
gpt-4-32k | gpt-4 モデルと同じ機能ですが、4 倍のコンテキスト長を持ちます。最新モデルのイテレーションで更新されます。 | 32,768 トークン | Up to Sep 2021 |
gpt-4-32k-0613 | 2023年6月13日からの gpt-4-32 のスナップショット。gpt-4-32k とは異なり、このモデルは更新を受け取らず、新しいバージョンがリリースされた後 3 ヶ月で deprecated となります。 | 32,768 トークン | Up to Sep 2021 |
多くの基本的なタスクについて、GPT-4 と GPT-3.5 モデルの間の違いは重要ではありません。けれども、より複雑な推論の状況では、GPT-4 は以前のどのモデルよりも遥かに性能が高いです。
GPT-3.5
GPT-3.5 モデルは自然言語やコードを理解して生成することができます。GPT-3.5 ファミリーの最も性能が高くコスト効率的なモデルは gpt-3.5-turbo で、これはチャット用に最適化されていますが、従来の補完タスクに対しても上手く機能します。
最新モデル | 説明 | 最大トークン | 訓練データ |
---|---|---|---|
gpt-3.5-turbo | 最も性能の高い GPT-3.5 モデルで text-davinci-003 の 10 分の 1 のコストでチャット用に最適化されています。リリース後 2 週間の周期で最新モデルにより更新されます。 | 4,096 トークン | Up to Sep 2021 |
gpt-3.5-turbo-16k | 標準 gpt-3.5-turbo モデルと同じ機能ですが、4 倍のコンテキストを持てます。 | 16,384 トークン | Up to Sep 2021 |
gpt-3.5-turbo-0613 | 2023年6月13日からの gpt-3.5-turbo のスナップショットで関数呼び出しデータを含みます。gpt-3.5-turbo とは異なり、このモデルは更新を受け取らず、新しいバージョンがリリースされた後 3 ヶ月で deprecated となります。 | 4,096 トークン | Up to Sep 2021 |
gpt-3.5-turbo-16k-0613 | 2023年6月13日からの gpt-3.5-turbo-16k のスナップショット。gpt-3.5-turbo-16k とは異なり、このモデルは更新を受け取らず、新しいバージョンがリリースされた後 3 ヶ月で deprecated となります。 | 16,384 トークン | Up to Sep 2021 |
その低いコストと改良された性能により、他の GPT-3.5 モデルよりも gpt-3.5-turbo を使用することを勧めます、
OpenAI モデルは非決定論的です、これは同一の入力が異なる出力を生成する可能性があることを意味します。temperature を 0 に設定すると出力はほぼ決定論的になりますが、少量の変動は残るかもしれません。
DALL·E
DALL·E は自然言語の記述からリアルな画像やアートを作成できる AI システムです。現在、プロンプトが与えられたとき、特定のサイズで新しい画像を作成したり、既存の画像を編集したり、ユーザが提供した画像のバリエーションを作成する機能をサポートしています。
API を使用して利用可能な現在の DALL·E モデルは DALL·E の 2nd イテレーションで、オリジナルモデルよりリアルで、正確で、4 倍高い解像度の画像を生成します。You can try it through the our Labs interface or via the API.
Whisper
Whisper は汎用目的の発話認識モデルです。それは多様な音声の大規模なデータセットで訓練され、多言語発話認識に加えて発話翻訳と言語識別を実行できるマルチタスクモデルでもあります。Whisper v2-large モデルは現在 whisper-1 モデル名で API を使用して利用可能です。
現在、Whisper のオープンソース・バージョン と API を通して利用可能なバージョンの間に違いはありません。ただし、API を通して最適化された推論プロセスを提供しており、これは API 経由の Whisper の実行を他の手法による実行よりも遥かに高速化しています。For more technical details on Whisper, you can read the paper.
埋め込み
埋め込みはテキストの数値表現で、これはテキストの 2 つの断片の間の関係性を測定するために使用できます。私たちの第 2 世代の埋め込みモデル、text-embedding-ada-002 は以前の 16 個の第 1 世代の埋め込みモデルを数分の 1 のコストで置き換えるために設計されています。埋め込みは検索、クラスタリング、リコメンデーション、異常検出、そして分類タスクのために有用です。アナウンスメント・ブログ投稿 で最新の埋め込みモデルについて更に読むことができます。
モデレーション
(訳注 : 原文 参照)
貴方のデータを私たちがどのように使用するか
貴方のデータは貴方のデータです。
2023年3月1日の時点で、OpenAI API に送られたデータは OpenAI モデルを訓練したり改良するために使用されません (明示的に オプトイン しない限りは)。オプトインする一つの利点は、モデルが時間とともに貴方のユースケースでより良くなる可能性があることです。
不正利用を識別するのを支援するため、API データは最大 30 日間保持される可能性があり、その後で削除されます (その他、法律で要求されない限りは)。機密性のあるアプリケーションを持つ信頼できるカスタマーについて、ゼロデータ保持 (retention) が利用できる場合があります。ゼロデータ保持により、リクエストとレスポンス本体はどのようなロギング機構にも永続化されず、リクエストを処理するためにメモリにだけ存在します。
このデータポリシーは ChatGPT や DALL·E Labs のような OpenAI の非 API コンシューマー・サービスには適用されませんので注意してください。
エンドポイントによるデフォルト利用ポリシー
(訳注: 原文 参照)
モデルエンドポイントの互換性
エンドポイント | モデル名 |
---|---|
/v1/chat/completions | gpt-4, gpt-4-0613, gpt-4-32k, gpt-4-32k-0613, gpt-3.5-turbo, gpt-3.5-turbo-0613, gpt-3.5-turbo-16k, gpt-3.5-turbo-16k-0613 |
/v1/completions (Legacy) | text-davinci-003, text-davinci-002, text-davinci-001, text-curie-001, text-babbage-001, text-ada-001, davinci, curie, babbage, ada |
/v1/audio/transcriptions | whisper-1 |
/v1/audio/translations | whisper-1 |
/v1/fine-tunes | davinci, curie, babbage, ada |
/v1/embeddings | text-embedding-ada-002, text-similarity-*-001, text-search-*-*-001, code-search-*-*-001 |
/v1/moderations | text-moderation-stable, text-moderation-latest |
This list does not include our first-generation embedding models nor our DALL·E models.
以上