OpenAI platform 1.x : Get Started : モデル (翻訳/解説)
翻訳 : クラスキャット セールスインフォメーション
作成日時 : 11/16/2023 (v1.2.4)
* 本ページは、以下のドキュメントを翻訳した上で適宜、補足説明したものです:
* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。
- 人工知能研究開発支援
- 人工知能研修サービス(経営者層向けオンサイト研修)
- テクニカルコンサルティングサービス
- 実証実験(プロトタイプ構築)
- アプリケーションへの実装
- 人工知能研修サービス
- PoC(概念実証)を失敗させないための支援
- お住まいの地域に関係なく Web ブラウザからご参加頂けます。事前登録 が必要ですのでご注意ください。
◆ お問合せ : 本件に関するお問い合わせ先は下記までお願いいたします。
- クラスキャット セールス・マーケティング本部 セールス・インフォメーション
- sales-info@classcat.com ; Website: www.classcat.com ; ClassCatJP
OpenAI platform 1.x : Get Started : モデル
新モデルが DevDay に公開されました
GPT-4 Turbo (128k コンテキストウィンドウ) と更新された GPT-3.5 Turbo (16k コンテキストウィンドウ) のプレビューリリースを発表できることにエキサイトしています。特に、両方のモデルは、改良された指示追従 (instruction following), JSON モード, より再現性の高い出力, そして並列関数呼び出しを備えています。
Learn more.
概要
OpenAI API は様々な機能と価格帯を持つ多様なモデルのセットにより強化されています。また 微調整 により特定のユースケースについて私たちのモデルにカスタマイズを行なうこともできます。
- GPT-4 と GPT-4 Turbo – GPT-3.5 上で改良したモデルのセットで、自然言語やコードを理解して生成することができます。
- GPT-3.5 – GPT-3 上で改良したモデルのセットで、自然言語やコードを理解して生成することができます。
- DALL·E – 自然言語のプロンプトが与えられたとき画像を生成して編集できるモデルです。
- TTS – テキストを自然な音の発話 (spoken audio) に変換できるモデルのセット。
- Whisper – 音声をテキストに変換できるモデル。
- Embeddings – テキストを数値形式に変換できるモデルのセット。
- Moderation – テキストが機密性が高いか安全でない可能性があるかを検出できる微調整済みモデルです。
- GPT base – 自然言語やコードを理解して生成することができる、指示追従のないモデルのセット。
- GPT-3 Legacy -自然言語を理解して生成することができるモデルのセット。
- Deprecated – 推奨される代替とともに deprecated されたモデルの完全なリスト
私たちはまた Point-E, Whisper, Jukebox と CLIP を含む、オープンソースのモデルも公開しています。
研究者のためのモデルインデックス にアクセスして、研究論文でフィーチャーされているモデルや、InstructGPT と GPT-3.5 のようなモデルシリーズ間の違いについて更に学習してください。
継続的なモデルアップグレード
gpt-3.5-turbo, gpt-4 と gpt-4-32k は最新のモデルバージョンを指します。これはリクエスト送信後の レスポンスオブジェクト を見て検証できます。レスポンスは使用される特定のモデルバージョンを含みます (e.g. gpt-3.5-turbo-0613)。
また、更新モデルが導入された後、少なくとも 3 ヶ月間は開発者が利用し続けることができる静的モデルバージョンも提供しています。モデル更新の新しいペースに伴い、様々なユースケースに対してモデルを改善するのに役立つように、人々が評価に貢献できるようにもしています。If you are interested, check out the OpenAI Evals repository.
以下のモデルは一時的なスナップショットで、それらの deprecation date を代替とともにアナウンスしています。最新のモデルバージョンを使用したい場合には、gpt-4 や gpt-3.5-turbo のような標準モデル名を使用してください。
モデル名 | DISCONTINUATION DATE | 代替モデル |
---|---|---|
gpt-3.5-turbo-0613 | 06/13/2024 | gpt-3.5-turbo-1106 |
gpt-3.5-turbo-0301 | 06/13/2024 | gpt-3.5-turbo-1106 |
gpt-4-0314 | 06/13/2024 | gpt-4-0613 |
gpt-4-32k-0314 | 06/13/2024 | gpt-4-32k-0613 |
Learn more about model deprecation on our deprecation page.
GPT-4 と GPT-4 Turbo
GPT-4 は大規模なマルチモーダル・モデル (テキスト入力や画像入力を受け取りテキストを出力) で、広範囲な一般的な知識と高度な推論機能のおかげで、以前のどのモデルよりも素晴らしい精度で困難な問題を解くことができます。GPT-4 は 有料のお客様 に対して OpenAI API で利用可能です。gpt-3.5-turbo のように、GPT-4 はチャット用に最適化されていますが、Chat Completions API を使用した従来の補完タスクに対しても上手く機能します。Learn how to use GPT-4 in our GPT guide.
モデル | 説明 | コンテキスト・ウィンドウ | 訓練データ |
---|---|---|---|
gpt-4-1106-preview | GPT-4 Turbo New 最新の GPT-4 モデルで、命令追従, JSON モード, 再現性の高い出力, 並列関数呼び出し, 等を装備します。最大 4,096 出力トークンを返します。このプレビューモデルはプロダクションなトラフィックにはまだ適切ではありません。Learn more. |
128,000 トークン | Up to Apr 2023 |
gpt-4-vision-preview | GPT-4 Turbo with vision New 他のすべての GPT-4 Turbo 機能に加えて、画像を理解する能力を持ちます。最大 4,096 出力トークンを返します。これはプレビューモデルバージョンで、プロダクションなトラフィックにはまだ適切ではありません。Learn more. |
128,000 トークン | Up to Apr 2023 |
gpt-4 | 現在 gpt-4-0613 を指します。continuous モデルアップグレード参照 | 8,192 トークン | Up to Sep 2021 |
gpt-4-32k | 現在 gpt-4-32k-0613 を指します。continuous モデルアップグレード参照 | 32,768 トークン | Up to Sep 2021 |
gpt-4-0613 | 2023年6月13日からの gpt-4 のスナップショットで関数呼び出しサポートを含みます。 | 8,192 トークン | Up to Sep 2021 |
gpt-4-32k-0613 | 2023年6月13日からの gpt-4 のスナップショットで関数呼び出しサポートを含みます。 | 32,768 トークン | Up to Sep 2021 |
gpt-4-0314 Legacy | 2023年3月14日からの gpt-4 のスナップショットで関数呼び出しサポートを含みます。このモデルバージョンは 2024年6月13日に deprecated になります。 | 8,192 トークン | Up to Sep 2021 |
gpt-4-32k-0314 Legacy | 2023年3月14日からの gpt-4-32k のスナップショットで関数呼び出しサポートを含みます。このモデルバージョンは 2024年6月13日に deprecated になります。 | 32,768 トークン | Up to Sep 2021 |
多くの基本的なタスクについて、GPT-4 と GPT-3.5 モデルの間の違いは重要ではありません。けれども、より複雑な推論の状況では、GPT-4 は以前のどのモデルよりも遥かに性能が高いです。
GPT-3.5
GPT-3.5 モデルは自然言語やコードを理解して生成することができます。GPT-3.5 ファミリーの最も性能が高くコスト効率的なモデルは gpt-3.5-turbo で、これは Chat Completions API を使用しチャット用に最適化されていますが、従来の補完タスクに対しても上手く機能します。
モデル | 説明 | コンテキスト・ウィンドウ | 訓練データ |
---|---|---|---|
gpt-3.5-turbo-1106 | Updated GPT-4 Turbo New 最新の GPT-3.5 Turbo モデルで、命令追従, JSON モード, 再現性の高い出力, 並列関数呼び出し, 等を装備します。最大 4,096 出力トークンを返します。Learn more. |
16,385 トークン | Up to Sep 2021 |
gpt-3.5-turbo | 現在 gpt-3.5-turbo-0613 を指します。2023年12月11日から gpt-3.5-turbo-1106 を指すようになります。continuous モデルアップグレード参照 | 8,192 トークン | Up to Sep 2021 |
gpt-3.5-turbo-16k | 現在 gpt-3.5-turbo-0613 を指します (訳注: 原文ママ)。2023年12月11日から gpt-3.5-turbo-1106 を指すようになります。continuous モデルアップグレード参照 | 16,385 トークン | Up to Sep 2021 |
gpt-3.5-turbo-instruct | text-davinci-003 と同様の機能ですが、Chat Completions ではなく legacy Completions エンドポイントと互換です。 | 4,096 トークン | Up to Sep 2021 |
gpt-3.5-turbo-0613 Legacy | 2023年6月13日からの gpt-3.5-turbo のスナップショットです。2024年6月13日に deprecated となります。 | 4,096 トークン | Up to Sep 2021 |
gpt-3.5-turbo-16k-0613 Legacy | 2023年6月13日からの gpt-3.5-16k-turbo のスナップショットです。2024年6月13日に deprecated となります。 | 16,385 トークン | Up to Sep 2021 |
gpt-3.5-turbo-0301 Legacy | 2023年3月1日からの gpt-3.5-turbo のスナップショットです。2024年6月13日に deprecated となります。 | 4,096 トークン | Up to Sep 2021 |
その低いコストと改良された性能により、他の GPT-3.5 モデルよりも gpt-3.5-turbo を使用することを勧めます。
DALL·E
DALL·E は自然言語の記述からリアルな画像やアートを作成できる AI システムです。DALL·E 3 は現在、プロンプトが与えられたとき、特定のサイズで新しい画像を作成する機能をサポートします。DALL·E 2 はまた既存の画像を編集したり、ユーザが提供した画像のバリエーションを作成する機能もサポートしています。
DALL·E 3 は DALL·E 2 とともに Images API を通して利用可能です。ChatGPT Plus で DALL·E 3 を試すことができます。
モデル | 説明 |
---|---|
dall-e-3 | DALL·E 3 New 2023年11月に公開された最新の DALL·E モデル。Learn more. |
dall-e-2 | 2022年11月に公開された以前の DALL·E モデル。DALL·E の 2nd イテレーションで、オリジナルモデルよりリアルで、正確で、4 倍高い解像度の画像を備えます。 |
TTS
TTS はテキストを自然な音の発話テキストに変換する AI モデルです。2 つの異なるモデルのバリエーションを提供しています、tts-1 はリアルタイムのテキスト-to-発話のユースケースに最適化され、tts-1-hd は品質のために最適化されています。これらのモデルは 音声 API の Speech エンドポイント で利用できます。
モデル | 説明 |
---|---|
tts-1 | Text-to-speech 1 New 最新のテキスト-to-発話モデルで、スピードに最適化されています。 |
tts-1-hd | Text-to-speech 1 HD New 最新のテキスト-to-発話モデルで、品質に最適化されています。 |
Whisper
Whisper は汎用目的の発話認識モデルです。それは多様な音声の大規模なデータセットで訓練され、多言語発話認識に加えて発話翻訳と言語識別を実行できるマルチタスクモデルでもあります。Whisper v2-large モデルは現在 whisper-1 モデル名で API を通して利用可能です。
現在、Whisper のオープンソース・バージョン と API を通して利用可能なバージョンの間に違いはありません。ただし、API を通して 最適化された推論プロセスを提供しており、これは API 経由の Whisper の実行を他の手法による実行よりも遥かに高速化しています。For more technical details on Whisper, you can read the paper.
埋め込み
埋め込みはテキストの数値表現で、これはテキストの 2 つの断片の間の関係性を測定するために使用できます。私たちの第2世代の埋め込みモデル、text-embedding-ada-002 は以前の 16 個の第1世代の埋め込みモデルを数分の 1 のコストで置き換えるために設計されています。埋め込みは検索、クラスタリング、リコメンデーション、異常検出、そして分類タスクのために役立ちます。アナウンスメント・ブログ投稿 で最新の埋め込みモデルについて更に読むことができます。
モデレーション
(訳注 : 原文 参照)
貴方のデータを私たちがどのように使用するか
貴方のデータは貴方のデータです (Your data is your data)。
2023年3月1日の時点で、OpenAI API に送られたデータは OpenAI モデルを訓練したり改良するために使用されません (明示的に オプトイン しない限りは)。オプトインする一つの利点は、モデルが時間とともに貴方のユースケースでより良くなる可能性があることです。
不正利用を識別するのを支援するため、API データは最大 30 日間保持される可能性があり、その後で削除されます (その他、法律で要求されない限りは)。機密性のある (sensitive) アプリケーションを持つ信頼できる顧客については、ゼロデータ保持 (retention) が利用できる場合があります。ゼロデータ保持により、リクエストとレスポンス本体はどのようなロギング機構にも永続化されず、リクエストを処理するためにメモリにだけ存在します。
このデータポリシーは ChatGPT や DALL·E Labs のような OpenAI の非 API コンシューマー・サービスには適用されませんので注意してください。
エンドポイントによるデフォルト利用ポリシー
(訳注: 原文 参照)
モデルエンドポイントの互換性
(訳注: 原文 参照)
以上