B

Bge Large En V1.5 Quant

由RedHatAI開發
BGE-large-en-v1.5的量化(INT8)ONNX變體,通過DeepSparse進行推理加速
下載量 1,094
發布時間 : 10/3/2023

模型概述

這是BGE-large-en-v1.5嵌入模型的量化版本,使用Sparsify進行量化優化,並通過DeepSparseSentenceTransformers實現推理加速。適用於需要高效文本嵌入的場景。

模型特點

高效推理
通過DeepSparse在10核筆記本電腦上實現4.8倍延遲提升,在16核AWS實例上實現3.5倍提升
量化優化
使用Sparsify進行INT8量化,保持模型性能的同時減少計算資源需求
多任務支持
支持語義文本相似度、文本分類和對分類等多種自然語言處理任務

模型能力

文本嵌入生成
語義相似度計算
文本分類
句子對分類

使用案例

文本相似度
文檔檢索
計算文檔間的語義相似度,用於信息檢索系統
在STS基準測試中達到86.6%的餘弦相似度皮爾遜相關係數
重複問題檢測
識別語義相似的重複問題
在SprintDuplicateQuestions數據集上達到99.85%的準確率
文本分類
情感分析
對文本進行情感傾向分類
在AmazonCounterfactual分類任務上達到75.54%的準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase