E

E5 Base

由intfloat開發
E5-base 是一個通用的文本嵌入模型,適用於多種自然語言處理任務,如分類、檢索、聚類和語義相似度計算。
下載量 30.85k
發布時間 : 12/26/2022

模型概述

E5-base 是一個基於 Transformer 架構的文本嵌入模型,能夠將文本轉換為高維向量表示,適用於多種下游任務。

模型特點

多任務支持
支持多種自然語言處理任務,包括分類、檢索、聚類和語義相似度計算。
高性能
在多個基準數據集上表現出色,如 MTEB 數據集。
通用性
適用於多種文本處理場景,無需針對特定任務進行大量調整。

模型能力

文本分類
文本檢索
文本聚類
語義相似度計算
文本重排序

使用案例

電子商務
商品評論分類
對亞馬遜商品評論進行分類,識別正面和負面評價。
在 MTEB AmazonPolarityClassification 數據集上準確率達到 87.96%。
商品檢索
根據用戶查詢檢索相關商品。
在 MTEB AmazonReviewsClassification 數據集上 F1 分數為 42.23。
學術研究
論文聚類
對 arXiv 和 BioRxiv 上的學術論文進行聚類。
在 MTEB ArxivClusteringP2P 數據集上 V-measure 為 44.57。
問答系統
重複問題檢測
在問答社區中檢測重複問題。
在 MTEB AskUbuntuDupQuestions 數據集上 MAP 為 59.66。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase