all-MiniLM-L2-v2オープンソースモデル - 推論速度を約2倍に向上、CPUとGPUで高精度

ホーム

All MiniLM L2 V2

tabularisaiによって開発

このモデルはall-MiniLM-L12-v2から蒸留されたもので、推論速度が約2倍向上し、CPUとGPUの両方で高い精度を維持しています。

テキスト埋め込み

Safetensors

複数言語対応オープンソースライセンス:Apache-2.0 #高速テキスト埋め込み #検索拡張生成 #軽量モデル

ダウンロード数 5,063

リリース時間 : 5/5/2025

モデル概要

文の類似度計算や検索拡張生成などのタスクに適した効率的なテキスト埋め込みモデルです。

モデル特徴

高速推論

all-MiniLM-L6-v2モデルと比較して、推論速度が約2倍向上

高精度

高速推論を維持しながら、元のモデルに近い精度を実現

軽量

モデルサイズが小さく、リソースが限られた環境に適しています

モデル能力

テキスト埋め込み

文の類似度計算

意味的検索

使用事例

情報検索

検索拡張生成(RAG)

RAGプロセスで検索器として使用し、関連ドキュメントを迅速に見つける

検索速度とシステムの応答時間を向上

意味的解析

文の類似度計算

2つの文の間の意味的類似度を計算

質問応答システムや重複検出などのシナリオに利用可能

🚀 最速のテキスト埋め込みモデル: tabularisai/all-MiniLM-L2-v2

このモデルはsentence-transformers/all-MiniLM-L12-v2から蒸留されたもので、最小のall-MiniLM-L6-v2モデルと比較して、推論速度が約2倍速く、CPUとGPUで高い精度を維持しています。

🚀 クイックスタート

このモデルは、高速で高精度なテキスト埋め込みを提供し、Sentence SimilarityやFeature Extractionなどのタスクに適しています。

✨ 主な機能

高速な推論: 最小のall-MiniLM-L6-v2モデルと比較して、推論速度が約2倍速くなります。
高い精度: CPUとGPUで高い精度を維持します。
汎用性: Sentence Similarity、Feature Extraction、RAGなどの様々なタスクに適用可能です。

📦 インストール

ライブラリをインストールするには、以下のコマンドを実行します。

pip install -U sentence-transformers

💻 使用例

基本的な使用法

Retrieval-Augmented Generation (RAG) の例

このモデルをRAGパイプラインのリトリーバーとして使用する例です。

from sentence_transformers import SentenceTransformer, util
import faiss
import numpy as np

# Load embedding model
model = SentenceTransformer("tabularisai/all-MiniLM-L2-v2")

# Your 5 simple documents
documents = [
    "Renewable energy comes from natural sources.",
    "Solar panels convert sunlight into electricity.",
    "Wind turbines harness wind power.",
    "Fossil fuels are non-renewable sources of energy.",
    "Hydropower uses water to generate electricity."
]

# Embed documents
doc_embeddings = model.encode(documents, convert_to_numpy=True)

# Create FAISS index
dim = doc_embeddings.shape[1]
index = faiss.IndexFlatL2(dim)
index.add(doc_embeddings)

# Query
query = "What are the benefits of renewable energy?"
query_embedding = model.encode([query], convert_to_numpy=True)

# Search top 3 similar docs
D, I = index.search(query_embedding, k=3)

# Print results
print("Query:", query)
print("\nTop 3 similar documents:")
for rank, idx in enumerate(I[0]):
    print(f"{rank+1}. {documents[idx]} (score: {D[0][rank]:.4f})")

文埋め込みの例

モデルをロードして文をエンコードする例です。

from sentence_transformers import SentenceTransformer

model = SentenceTransformer("tabularisai/all-MiniLM-L2-v2")

sentences = [
    "The weather is lovely today.",
    "It's so sunny outside!",
    "He drove to the stadium.",
]

embeddings = model.encode(sentences)
print(embeddings.shape)  # [3, 384]

similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)  # [3, 3]

📚 ドキュメント

プロパティ	詳細
タグ	sentence-transformers, sentence-similarity, feature-extraction, rag
ベースモデル	sentence-transformers/all-MiniLM-L6-v2
パイプラインタグ	sentence-similarity
ライブラリ名	sentence-transformers