mxbai-embed-large-v1オープンソース文埋め込みモデル - 無料で英語のテキスト埋め込みと多様な量子化要件をサポート

Mxbai Embed Large V1 Gguf

ChristianAzinnによって開発

mxbai-embed-large-v1はBERT-largeアーキテクチャに基づく文埋め込みモデルで、AnglE損失関数を使用してトレーニングされ、英語テキスト埋め込みをサポートし、さまざまなニーズに対応するための複数の量子化バージョンを提供します。

テキスト埋め込み英語オープンソースライセンス:Apache-2.0 #英語テキスト埋め込み #BERT大規模モデル #高精度ベクトル化

ダウンロード数 646

リリース時間 : 4/7/2024

モデル概要

これは高品質の文埋め込みモデルで、BERT-largeアーキテクチャに基づき、AnglE損失関数を使用して大規模データでトレーニングされています。モデルは2ビットから32ビットまでの複数の量子化バージョンを提供し、さまざまな計算リソースシナリオに適しています。

モデル特徴

高品質文埋め込み

AnglE損失関数を使用して大規模な高品質データでトレーニングされ、BERT-large規模でSOTA性能を達成します。

複数の量子化バージョン

2ビット(Q2_K)から32ビット(FP32)までの複数の量子化バージョンを提供し、さまざまな計算リソースのニーズに対応します。

512トークンのコンテキスト長

最大512トークンのコンテキスト長をサポートし、長いテキストの処理に適しています。

広範な互換性

llama.cppやLM Studioなどの主流の推論フレームワークと互換性があります。

モデル能力

テキスト埋め込み

意味検索

情報検索

テキスト類似度計算

使用事例

検索と検索

意味検索

クエリとドキュメントを埋め込みベクトルに変換して意味類似度をマッチングします。

検索結果の関連性を向上させます。

ドキュメントクラスタリング

埋め込みベクトルに基づいてドキュメントをクラスタリング分析します。

ドキュメント間の意味関係を発見します。

レコメンドシステム

コンテンツ推薦

コンテンツ埋め込みの類似度に基づいて関連コンテンツを推薦します。

推薦の精度と多様性を向上させます。

🚀 mxbai-embed-large-v1-gguf

このモデルは、高品質な大規模データを使用して訓練された文埋め込みモデルです。GGUF形式のファイルを提供しており、複数の環境での使用に対応しています。

🚀 クイックスタート

モデル作成者: MixedBread AI 元のモデル: mxbai-embed-large-v1

✨ 主な機能

元の説明

これは当社の基本的な文埋め込みモデルです。高品質な大規模データを使用して、AnglE損失を用いて訓練されました。BERT-largeスケールでSOTA性能を達成しています。詳細はブログ記事を参照してください。

説明

このリポジトリには、mxbai-embed-large-v1埋め込みモデルのGGUF形式のファイルが含まれています。これらのファイルは、consumer RTX 4090上でllama.cpp PR 5500、コミット 34aa045de を使用して変換および量子化されました。このモデルは、最大512トークンのコンテキストをサポートしています。

互換性

これらのファイルは、コミット 4524290e8 以降の llama.cpp およびバージョン0.2.19以降の LM Studio と互換性があります。

📚 ドキュメント

量子化方法の説明

詳細を表示するにはクリック

利用可能な方法は以下の通りです。 * GGML_TYPE_Q2_K - 16個のブロックを含むスーパーブロックでの「タイプ1」の2ビット量子化。各ブロックには16個の重みがあります。ブロックのスケールと最小値は4ビットで量子化されます。これにより、重み1つあたり実効的に2.5625ビット (bpw) が使用されます。 * GGML_TYPE_Q3_K - 16個のブロックを含むスーパーブロックでの「タイプ0」の3ビット量子化。各ブロックには16個の重みがあります。スケールは6ビットで量子化されます。これにより、3.4375bpwが使用されます。 * GGML_TYPE_Q4_K - 8個のブロックを含むスーパーブロックでの「タイプ1」の4ビット量子化。各ブロックには32個の重みがあります。スケールと最小値は6ビットで量子化されます。これにより、4.5bpwが使用されます。 * GGML_TYPE_Q5_K - 「タイプ1」の5ビット量子化。GGML_TYPE_Q4_Kと同じスーパーブロック構造で、5.5bpwになります。 * GGML_TYPE_Q6_K - 「タイプ0」の6ビット量子化。16個のブロックを含むスーパーブロック。各ブロックには16個の重みがあります。スケールは8ビットで量子化されます。これにより、6.5625bpwが使用されます。以下の「提供されるファイル」表を参照して、どのファイルがどの方法を使用しているかを確認してください。

提供されるファイル

名前	量子化方法	ビット数	サイズ	使用ケース
mxbai-embed-large-v1.Q2_K.gguf	Q2_K	2	144 MB	最も小さいが、品質の損失が大きい - ほとんどの目的には推奨されない
mxbai-embed-large-v1.Q3_K_S.gguf	Q3_K_S	3	160 MB	非常に小さいが、品質の損失が大きい
mxbai-embed-large-v1.Q3_K_M.gguf	Q3_K_M	3	181 MB	非常に小さいが、品質の損失が大きい
mxbai-embed-large-v1.Q3_K_L.gguf	Q3_K_L	3	198 MB	小さいが、品質の損失が大きい
mxbai-embed-large-v1.Q4_0.gguf	Q4_0	4	200 MB	レガシー; 小さいが、品質の損失が非常に大きい - Q3_K_Mの使用を推奨
mxbai-embed-large-v1.Q4_K_S.gguf	Q4_K_S	4	203 MB	小さいが、品質の損失が大きい
mxbai-embed-large-v1.Q4_K_M.gguf	Q4_K_M	4	216 MB	中程度で、品質がバランスしている - 推奨
mxbai-embed-large-v1.Q5_0.gguf	Q5_0	5	237 MB	レガシー; 中程度で、品質がバランスしている - Q4_K_Mの使用を推奨
mxbai-embed-large-v1.Q5_K_S.gguf	Q5_K_S	5	237 MB	大きいが、品質の損失が小さい - 推奨
mxbai-embed-large-v1.Q5_K_M.gguf	Q5_K_M	5	246 MB	大きいが、品質の損失が非常に小さい - 推奨
mxbai-embed-large-v1.Q6_K.gguf	Q6_K	6	278 MB	非常に大きいが、品質の損失が極めて小さい
mxbai-embed-large-v1.Q8_0.gguf	Q8_0	8	358 MB	非常に大きいが、品質の損失が極めて小さい - 推奨
mxbai-embed-large-v1.Q8_0.gguf	FP16	16	670 MB	非常に大きく、ほぼ元のモデル - 推奨されない
mxbai-embed-large-v1.Q8_0.gguf	FP32	32	1.34 GB	非常に大きく、ほぼ元のモデル - 推奨されない

💻 使用例

基本的な使用法

llama.cppでの使用例

単一の埋め込みを計算するには、llama.cppをビルドして以下のコマンドを実行します。

./embedding -ngl 99 -m [filepath-to-gguf].gguf -p 'search_query: What is TSNE?'

また、トークンの総数がコンテキスト長を超えない限り、複数のテキストをバッチで送信して埋め込むこともできます。embeddingの例では、最初の3つの埋め込みのみが表示されます。

texts.txt:

search_query: What is TSNE?
search_query: Who is Laurens Van der Maaten?

複数の埋め込みを計算するには、以下のコマンドを実行します。

./embedding -ngl 99 -m [filepath-to-gguf].gguf -f texts.txt

LM Studioでの使用例

以下から0.2.19ベータビルドをダウンロードします。 Windows MacOS Linux

インストール後、アプリを開きます。ホーム画面は以下のように表示されます。

image/png

メイン検索バーで「ChristianAzinn」を検索するか、左メニューの「Search」タブに移動してそこで名前を検索します。

image/png

表示されたモデルから自分のモデルを選択し（この例では bge-small-en-v1.5-gguf を使用）、ダウンロードする量子化を選択します。このモデルは比較的小さいため、Q8_0をお勧めします。一般的に、リストの下に行くほど（または数字が大きくなるほど）、ファイルサイズが大きく、パフォーマンスが良くなります。

image/png

モデルが正常にダウンロードされると、緑色のチェックマークと「Downloaded」という単語が表示されます。これにはネットワーク速度に応じて時間がかかる場合があります。

image/png

このモデルのダウンロードが完了したら、左メニューの「Local Server」タブに移動し、テキスト埋め込みモデルのローダーを開きます。このローダーはバージョン0.2.19以前では表示されないため、正しいバージョンをダウンロードしていることを確認してください。

image/png

表示されるドロップダウンから、先ほどダウンロードしたモデルを選択してロードします。VRAMに完全に収まらない場合は、右側のメニューでGPUオフロードなどの設定を調整する必要がある場合があります。

image/png

最後に、「Start Server」ボタンをクリックします。

image/png

コンソールに以下のようなテキストが表示されれば、準備完了です！これを、OpenAI埋め込みAPIを必要とする任意のアプリケーションでそのまま置き換えて使用することができます。また、エンドポイントに直接クエリを送信してテストすることもできます。

image/png

APIエンドポイントへの例のcurlリクエスト:

curl http://localhost:1234/v1/embeddings \
  -H "Content-Type: application/json" \
  -d '{
    "input": "Your text string goes here",
    "model": "model-identifier-here"
  }'

詳細については、LM Studioのテキスト埋め込みドキュメントを参照してください。