bge-large-en-v1.5-quantオープンソースモデル - 高速化推論により、効率的なアプリケーションに強力なサポートを提供！

ホーム

Bge Large En V1.5 Quant

RedHatAIによって開発

BGE-large-en-v1.5の量子化(INT8)ONNXバリアント、DeepSparseによる推論加速

テキスト埋め込み

Transformers

英語オープンソースライセンス:MIT #INT8量子化 #意味的類似性計算 #低遅延推論

ダウンロード数 1,094

リリース時間 : 10/3/2023

モデル概要

これはBGE-large-en-v1.5埋め込みモデルの量子化バージョンで、Sparsifyを使用して量子化最適化を行い、DeepSparseSentenceTransformersで推論を加速します。効率的なテキスト埋め込みが必要なシナリオに適しています。

モデル特徴

効率的な推論

DeepSparseにより、10コアのノートパソコンで4.8倍の遅延改善、16コアのAWSインスタンスで3.5倍の改善を実現

量子化最適化

Sparsifyを使用したINT8量子化により、モデル性能を維持しながら計算リソース要件を削減

マルチタスクサポート

意味的テキスト類似性、テキスト分類、ペア分類など、さまざまな自然言語処理タスクをサポート

モデル能力

テキスト埋め込み生成

意味的類似性計算

テキスト分類

文ペア分類

使用事例

テキスト類似性

ドキュメント検索

情報検索システム向けにドキュメント間の意味的類似性を計算

STSベンチマークで86.6%のコサイン類似性ピアソン相関係数を達成

重複質問検出

意味的に類似した重複質問を識別

SprintDuplicateQuestionsデータセットで99.85%の精度を達成

テキスト分類

感情分析

テキストの感情傾向を分類

AmazonCounterfactual分類タスクで75.54%の精度を達成

🚀 bge-large-en-v1.5-quant

このモデルは、量子化（INT8）ONNXバリアントの埋め込みモデルで、Sparsifyによる量子化とDeepSparseSentenceTransformersによる推論が行われ、推論速度を向上させます。

🚀 クイックスタート

このモデルは、bge-large-en-v1.5 埋め込みモデルの量子化（INT8）ONNXバリアントで、Sparsify を使って量子化を行い、DeepSparseSentenceTransformers を使って推論を行います。

DeepSparse を使用することで、10コアのラップトップではレイテンシ性能を4.8倍、16コアのAWSインスタンスでは最大3.5倍向上させることができます。

✨ 主な機能

高速化：DeepSparseを使用することで、レイテンシ性能を大幅に向上させることができます。
量子化：Sparsifyを使用して量子化を行い、モデルのサイズを削減し、推論速度を向上させます。
簡単な使用方法：DeepSparseSentenceTransformersを使用することで、簡単にモデルを使用することができます。

📦 インストール

必要なライブラリをインストールするには、以下のコマンドを実行します。

pip install -U deepsparse-nightly[sentence_transformers]

💻 使用例

基本的な使用法

from deepsparse.sentence_transformers import DeepSparseSentenceTransformer
model = DeepSparseSentenceTransformer('neuralmagic/bge-large-en-v1.5-quant', export=False)

# Our sentences we like to encode
sentences = ['This framework generates embeddings for each input sentence',
    'Sentences are passed as a list of string.',
    'The quick brown fox jumps over the lazy dog.']

# Sentences are encoded by calling model.encode()
embeddings = model.encode(sentences)

# Print the embeddings
for sentence, embedding in zip(sentences, embeddings):
    print("Sentence:", sentence)
    print("Embedding:", embedding.shape)
    print("")

コミュニティへの問い合わせ

これらのモデルや疎化手法に関する一般的な質問については、コミュニティSlack でエンジニアリングチームに問い合わせてください。

📚 ドキュメント

モデルの評価結果

タスクタイプ	データセット	メトリクス	値
Classification	MTEB AmazonCounterfactualClassification (en)	accuracy	75.53731343283583
Classification	MTEB AmazonCounterfactualClassification (en)	ap	38.30609312253564
Classification	MTEB AmazonCounterfactualClassification (en)	f1	69.42802757893695
STS	MTEB BIOSSES	cos_sim_pearson	89.27346145216443
STS	MTEB BIOSSES	cos_sim_spearman	88.36526647458979
STS	MTEB BIOSSES	euclidean_pearson	86.83053354694746
STS	MTEB BIOSSES	euclidean_spearman	87.56223612880584
STS	MTEB BIOSSES	manhattan_pearson	86.59250609226758
STS	MTEB BIOSSES	manhattan_spearman	87.70681773644885
...（他の結果も同様に表にまとめる）	...	...	...