E

E5 Large En Ru

由d0rj開發
這是intfloat/multilingual-e5-large模型的詞彙表剪枝版本,僅保留俄語和英語詞元,保持了原版模型的性能表現。
下載量 712
發布時間 : 9/18/2023

模型概述

E5-large-en-ru是一個多語言文本嵌入模型,專門針對俄語和英語進行了優化,適用於信息檢索、語義相似度計算等任務。

模型特點

詞彙表優化
通過剪枝僅保留俄語和英語詞元,顯著減小模型體積同時保持性能
高性能檢索
在SberQuAD基準測試中表現優異,各項指標與原版模型相當
多任務適配
支持通過前綴區分不同任務類型(查詢/段落/對稱任務)

模型能力

文本向量化
語義相似度計算
信息檢索
跨語言文本匹配

使用案例

信息檢索
開放域問答
用於檢索與問題最相關的文檔段落
在SberQuAD測試中recall@5達到82.8%
語義分析
文檔相似度計算
比較不同文檔之間的語義相似度
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase