LanceDB : 概要 (README) (翻訳/解説)
翻訳 : (株)クラスキャット セールスインフォメーション
作成日時 : 09/19/2023 (v0.2.6)
* 本ページは、lancedb/lancedb レポジトリの以下のドキュメントを翻訳した上で適宜、補足説明したものです:
* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。
クラスキャット 人工知能 研究開発支援サービス
◆ クラスキャット は人工知能・テレワークに関する各種サービスを提供しています。お気軽にご相談ください :
- 人工知能研究開発支援
- 人工知能研修サービス(経営者層向けオンサイト研修)
- テクニカルコンサルティングサービス
- 実証実験(プロトタイプ構築)
- アプリケーションへの実装
- 人工知能研修サービス
- PoC(概念実証)を失敗させないための支援
◆ 人工知能とビジネスをテーマに WEB セミナーを定期的に開催しています。スケジュール。
- お住まいの地域に関係なく Web ブラウザからご参加頂けます。事前登録 が必要ですのでご注意ください。
◆ お問合せ : 本件に関するお問い合わせ先は下記までお願いいたします。
- 株式会社クラスキャット セールス・マーケティング本部 セールス・インフォメーション
- sales-info@classcat.com ; Web: www.classcat.com ; ClassCatJP
LanceDB : 概要 (README)
LanceDB は永続ストレージで構築されたベクトル検索用のオープンソースのデータベースで、埋め込みの検索、フィルタリングと管理を大きく単純化します。
LanceDB の主要な機能は以下を含みます :
- 管理するサーバが必要ない実運用スケールのベクトル検索。
- ベクトル、メタデータとマルチモーダル・データ (テキスト, 画像, 動画, ポイントクラウド, 等) のストア、クエリーとフィルタリングを実行します。
- ベクトル類似性検索、全文検索と SQL のサポート。
- ネイティブ Python と Javascript/Typescript のサポート。
- ゼロコピー, 自動バージョン管理, 追加のインフラを必要とすることなくデータのバージョンを管理します。
- LangChain 🦜️🔗, LlamaIndex 🦙, Apache-Arrow, Pandas, Polars, DuckDB 等とのエコシステム統合が進行中。
LanceDB のコアは Rust 🦀 で書かれ、高パフォーマンス ML ワークロード用に設計されたオープンソースの列指向データフォーマット (columnar format)、Lance を使用して構築されています。
クイックスタート
Javascript
npm install vectordb
const lancedb = require('vectordb');
const db = await lancedb.connect('data/sample-lancedb');
const table = await db.createTable('vectors',
[{ id: 1, vector: [0.1, 0.2], item: "foo", price: 10 },
{ id: 2, vector: [1.1, 1.2], item: "bar", price: 50 }])
const query = table.search([0.1, 0.3]);
query.limit = 20;
const results = await query.execute();
Python
pip install lancedb
import lancedb
uri = "data/sample-lancedb"
db = lancedb.connect(uri)
table = db.create_table("my_table",
data=[{"vector": [3.1, 4.1], "item": "foo", "price": 10.0},
{"vector": [5.9, 26.5], "item": "bar", "price": 20.0}])
result = table.search([100, 100]).limit(2).to_df()
ブログ、チュートリアル & 動画
以上