Skip to content

ClasCat® AI Research

クラスキャット – 生成 AI, AI エージェント, MCP

Menu
  • ホーム
    • ClassCat® AI Research ホーム
    • クラスキャット・ホーム
  • OpenAI API
    • OpenAI Python ライブラリ 1.x : 概要
    • OpenAI ブログ
      • GPT の紹介
      • GPT ストアの紹介
      • ChatGPT Team の紹介
    • OpenAI platform 1.x
      • Get Started : イントロダクション
      • Get Started : クイックスタート (Python)
      • Get Started : クイックスタート (Node.js)
      • Get Started : モデル
      • 機能 : 埋め込み
      • 機能 : 埋め込み (ユースケース)
      • ChatGPT : アクション – イントロダクション
      • ChatGPT : アクション – Getting started
      • ChatGPT : アクション – アクション認証
    • OpenAI ヘルプ : ChatGPT
      • ChatGPTとは何ですか?
      • ChatGPT は真実を語っていますか?
      • GPT の作成
      • GPT FAQ
      • GPT vs アシスタント
      • GPT ビルダー
    • OpenAI ヘルプ : ChatGPT > メモリ
      • FAQ
    • OpenAI ヘルプ : GPT ストア
      • 貴方の GPT をフィーチャーする
    • OpenAI Python ライブラリ 0.27 : 概要
    • OpenAI platform
      • Get Started : イントロダクション
      • Get Started : クイックスタート
      • Get Started : モデル
      • ガイド : GPT モデル
      • ガイド : 画像生成 (DALL·E)
      • ガイド : GPT-3.5 Turbo 対応 微調整
      • ガイド : 微調整 1.イントロダクション
      • ガイド : 微調整 2. データセットの準備 / ケーススタディ
      • ガイド : 埋め込み
      • ガイド : 音声テキスト変換
      • ガイド : モデレーション
      • ChatGPT プラグイン : イントロダクション
    • OpenAI Cookbook
      • 概要
      • API 使用方法 : レート制限の操作
      • API 使用方法 : tiktoken でトークンを数える方法
      • GPT : ChatGPT モデルへの入力をフォーマットする方法
      • GPT : 補完をストリームする方法
      • GPT : 大規模言語モデルを扱う方法
      • 埋め込み : 埋め込みの取得
      • GPT-3 の微調整 : 分類サンプルの微調整
      • DALL-E : DALL·E で 画像を生成して編集する方法
      • DALL·E と Segment Anything で動的マスクを作成する方法
      • Whisper プロンプティング・ガイド
  • Gemini API
    • Tutorials : クイックスタート with Python (1) テキスト-to-テキスト生成
    • (2) マルチモーダル入力 / 日本語チャット
    • (3) 埋め込みの使用
    • (4) 高度なユースケース
    • クイックスタート with Node.js
    • クイックスタート with Dart or Flutter (1) 日本語動作確認
    • Gemma
      • 概要 (README)
      • Tutorials : サンプリング
      • Tutorials : KerasNLP による Getting Started
  • Keras 3
    • 新しいマルチバックエンド Keras
    • Keras 3 について
    • Getting Started : エンジニアのための Keras 入門
    • Google Colab 上のインストールと Stable Diffusion デモ
    • コンピュータビジョン – ゼロからの画像分類
    • コンピュータビジョン – 単純な MNIST convnet
    • コンピュータビジョン – EfficientNet を使用した微調整による画像分類
    • コンピュータビジョン – Vision Transformer による画像分類
    • コンピュータビジョン – 最新の MLPモデルによる画像分類
    • コンピュータビジョン – コンパクトな畳込み Transformer
    • Keras Core
      • Keras Core 0.1
        • 新しいマルチバックエンド Keras (README)
        • Keras for TensorFlow, JAX, & PyTorch
        • 開発者ガイド : Getting started with Keras Core
        • 開発者ガイド : 関数型 API
        • 開発者ガイド : シーケンシャル・モデル
        • 開発者ガイド : サブクラス化で新しい層とモデルを作成する
        • 開発者ガイド : 独自のコールバックを書く
      • Keras Core 0.1.1 & 0.1.2 : リリースノート
      • 開発者ガイド
      • Code examples
      • Keras Stable Diffusion
        • 概要
        • 基本的な使い方 (テキスト-to-画像 / 画像-to-画像変換)
        • 混合精度のパフォーマンス
        • インペインティングの簡易アプリケーション
        • (参考) KerasCV – Stable Diffusion を使用した高性能画像生成
  • TensorFlow
    • TF 2 : 初級チュートリアル
    • TF 2 : 上級チュートリアル
    • TF 2 : ガイド
    • TF 1 : チュートリアル
    • TF 1 : ガイド
  • その他
    • 🦜️🔗 LangChain ドキュメント / ユースケース
    • Stable Diffusion WebUI
      • Google Colab で Stable Diffusion WebUI 入門
      • HuggingFace モデル / VAE の導入
      • LoRA の利用
    • Diffusion Models / 拡散モデル
  • クラスキャット
    • 会社案内
    • お問合せ
    • Facebook
    • ClassCat® Blog
Menu

🦙 LlamaIndex 0.8 : Getting Started : 上位コンセプト

Posted on 11/11/202311/11/2023 by Sales Information

🦙 LlamaIndex 0.8 : Getting Started : 上位コンセプト (翻訳/解説)

翻訳 : クラスキャット セールスインフォメーション
作成日時 : 11/10/2023 (v0.8.59)

* 本ページは、LlamaIndex の以下のドキュメントを翻訳した上で適宜、補足説明したものです:

  • Getting Started : High-Level Concepts

* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。

 

クラスキャット 人工知能 研究開発支援サービス

◆ クラスキャット は人工知能・テレワークに関する各種サービスを提供しています。お気軽にご相談ください :

ClassCat Chatbot

  • 人工知能研究開発支援
    1. 人工知能研修サービス(経営者層向けオンサイト研修)
    2. テクニカルコンサルティングサービス
    3. 実証実験(プロトタイプ構築)
    4. アプリケーションへの実装

  • 人工知能研修サービス

  • PoC(概念実証)を失敗させないための支援
◆ 人工知能とビジネスをテーマに WEB セミナーを定期的に開催しています。スケジュール。
  • お住まいの地域に関係なく Web ブラウザからご参加頂けます。事前登録 が必要ですのでご注意ください。

◆ お問合せ : 本件に関するお問い合わせ先は下記までお願いいたします。

  • クラスキャット セールス・マーケティング本部 セールス・インフォメーション
  • sales-info@classcat.com  ;  Website: www.classcat.com  ;   ClassCatJP

 

🦙 LlamaIndex 0.8 : Getting Started : 上位コンセプト

これは、LLM アプリケーションを構築するときに頻繁に遭遇する上位コンセプトへの簡単なガイドです。

 

検索拡張生成 (RAG, Retrieval Augmented Generation)

LLM は膨大なデータの集合で訓練されますが、それらは 貴方の データでは訓練されません。検索拡張生成 (RAG) は、貴方のデータを LLM が既にアクセスできるデータに追加することによりこの問題を解決します。このドキュメントでは RAG への参照を頻繁に見るはずです。

RAG では、貴方のデータはロードされてクエリーのために準備、あるいは「インデックス作成」されます。ユーザクエリーはインデックス上で作用し、これはデータを最も関連性の高いコンテキストへとフィルタリングします。次にこのコンテキストとクエリーはプロンプトと一緒に LLM に送られ、そして LLM はレスポンスを返します。

貴方が構築しているものがチャットボットであれエージェントであれ、データをアプリケーションに組み込むために RAG テクニックを知ることを望むでしょう。

 

RAG 内部のステージ

RAG 内には 5 つの主要なステージがあります、これらは順番に構築している大きなアプリケーションの一部となります。これらは :

  • ロード (Loading) : これは、貴方のデータをそれが存在する場所から (それがテキストファイル, PDF, 別の Web サイト, データベース, あるいは API であれ) 貴方のパイプラインに組み込みことを指します。LlamaHub はそこから選択できる数百のコネクタを提供しています。

  • インデックス作成 (Indexing) : これは、データをクエリーすることを可能にするデータ構造を作成することを意味します。LLM については、これは殆ど常にベクトル埋め込み – データの意味の数値表現 – そして文脈的に関連するデータを正確に見つけることを簡単にする、多数の他のメタデータストラテジーを作成することを意味します。

  • 保存 (Storing) : 貴方のデータのインデックスが作成されると、それを再インデックス化することを避けるためにインデックスと他のメタデータを保存することを殆ど常に望むはずです。

  • クエリー (Querying) : 与えられたインデックス付けストラテジーに対して、サブクエリー、マルチステップ・クエリーそしてハイブリッドストラテジーを含む、クエリーをするために LLM と LlamaIndex データ構造を利用できる多くの方法があります。

  • 評価 : 任意のパイプラインで重要なステップは、他のストラテジーと比較して、あるいは変更を加えたときどれほど効果的か確認することです。評価は、クエリーに対するレスポンスがどれほど正確で、忠実で高速かの客観的な尺度を提供します。

 

各ステップ内の重要なコンセプト

これらの各ステージ内のステップを指す、貴方が遭遇する幾つかの用語もあります。

 

ローディング・ステージ

ノードと Document : Document は任意のデータソース – 例えば、PDF, API 出力, あるいはデータベースからの検索データ – 周りのコンテナです。ノードは LlamaIndex のデータのアトミックなユニットでソースドキュメントの Document の「チャンク」を表します。ノードはそれらが含まれる document や他のノードに関連づけるメタデータを持ちます。

コネクタ : データコネクタ (Reader と呼ばれる場合も多いです) は様々なデータソースやデータ形式からデータを Document とノードに取り込みます。

 

インデックス作成ステージ

インデックス : データをひとたび取り込めば、LlamaIndex はデータを検索取得しやすい構造にインデックス作成するのに役立ちます。これは通常はベクトル埋め込みを生成することを含みます、これはベクトルストアと呼ばれる特殊なデータベースにストアされます。インデックスはまたデータについての様々なメタデータもストアできます。

埋め込み : LLM は埋め込みと呼ばれるデータの数値表現を生成します。関連性についてデータをフィルタリングするとき、LlamaIndex はクエリーを埋め込みに変換し、ベクトルストアはクエリーの埋め込みに数値的に類似したデータを見つけます。

 

クエリーステージ

Retrievers : retriever は、クエリーが与えられたとき関連するコンテキストをインデックスから効率的に検索取得する方法を定義します。検索取得ストラテジーは検索されるデータの関連性とそれにより行われる効率性へのキーとなります。

ノード・ポストプロセッサ : ノード・ポストプロセッサは検索取得されたノードのセットを受け取り、それらに変換、フィルタリングや再ランク付けロジックを適用します。

レスポンス・シンセサイザー : レスポンス・シンセサイザーは、ユーザクエリーと検索取得されたテキストチャンクの与えられたセットを使用して、LLM からレスポンスを生成します。

 

すべてをまとめる

データに支援された LLM アプリケーションのユースケースは無限にありますが、それらはおおよそ 3 つのカテゴリーにグループ分けできます :

クエリーエンジン : クエリーエンジンは貴方のデータに対して質問を尋ねることを可能にする end-to-end なパイプラインです。それは自然言語のクエリーを受け取り、検索取得されて LLM に渡される参照コンテキストとともに、レスポンスを返します。

チャットエンジン : チャットエンジンは貴方のデータとの会話をするための end-to-end なパイプラインです (単一の質問 & 応答の代わりに複数のやり取りを持ちます)。

エージェント : エージェントは LLM により強化された自動化された意思決定者 (decision maker) で、ツール のセットを通して世界と相互作用します。エージェントは与えられたタスクを完了するために任意の数のステップを取り、事前決定されたステップに従うのではなく、最善策なアクションを動的に決定できます。これはより複雑なタスクに取り組むための更なる柔軟性をそれに与えます。

 

以上



クラスキャット

最近の投稿

  • Agno : コンセプト : エージェント – 知識
  • Agno : コンセプト : エージェント – エージェント・コンテキスト
  • Agno : コンセプト : エージェント – プロンプト
  • Agno : コンセプト : エージェント – ユーザ制御フロー (Human in the Loop)
  • Agno : コンセプト : エージェント – マルチモーダル・エージェント

タグ

Agno (17) AutoGen (13) ClassCat Press Release (20) ClassCat TF/ONNX Hub (11) DGL 0.5 (14) Eager Execution (7) Edward (17) FLUX.1 (16) Gemini (20) HuggingFace Transformers 4.5 (10) HuggingFace Transformers 4.6 (7) HuggingFace Transformers 4.29 (9) Keras 2 Examples (98) Keras 2 Guide (16) Keras 3 (10) Keras Release Note (17) Kubeflow 1.0 (10) LangChain (45) LangGraph (24) LangGraph 0.5 (9) MediaPipe 0.8 (11) Model Context Protocol (16) NNI 1.5 (16) OpenAI Agents SDK (8) OpenAI Cookbook (13) OpenAI platform (10) OpenAI platform 1.x (10) OpenAI ヘルプ (8) TensorFlow 2.0 Advanced Tutorials (33) TensorFlow 2.0 Advanced Tutorials (Alpha) (15) TensorFlow 2.0 Advanced Tutorials (Beta) (16) TensorFlow 2.0 Guide (10) TensorFlow 2.0 Guide (Alpha) (16) TensorFlow 2.0 Guide (Beta) (9) TensorFlow 2.0 Release Note (12) TensorFlow 2.0 Tutorials (20) TensorFlow 2.0 Tutorials (Alpha) (14) TensorFlow 2.0 Tutorials (Beta) (12) TensorFlow 2.4 Guide (24) TensorFlow Deploy (8) TensorFlow Probability (9) TensorFlow Programmer's Guide (22) TensorFlow Release Note (18) TensorFlow Tutorials (33) TF-Agents 0.4 (11)
2023年11月
月 火 水 木 金 土 日
 12345
6789101112
13141516171819
20212223242526
27282930  
« 10月   12月 »
© 2025 ClasCat® AI Research | Powered by Minimalist Blog WordPress Theme