E

E5 Base Multilingual 4096

由efederici開發
E5-base-multilingual-4096是基於intfloat/multilingual-e5-base的局部稀疏全局版本,支持處理最多4096個標記的多語言文本嵌入模型。
下載量 340
發布時間 : 6/15/2023

模型概述

該模型是多語言文本嵌入模型,專門用於句子相似度任務,能夠處理多種語言的文本並生成高質量的嵌入向量。

模型特點

多語言支持
支持超過100種語言的文本嵌入,包括主要的世界語言和許多小眾語言。
長文本處理
能夠處理最多4096個標記的長文本,適合處理較長的文檔和段落。
高質量嵌入
基於弱監督對比預訓練方法,生成高質量的文本嵌入向量。

模型能力

多語言文本嵌入
句子相似度計算
跨語言信息檢索

使用案例

信息檢索
跨語言文檔檢索
使用該模型可以檢索不同語言但內容相似的文檔。
提高跨語言檢索的準確性和效率
問答系統
多語言問答
構建支持多種語言的問答系統,能夠理解不同語言的查詢並返回相關答案。
提升問答系統的語言覆蓋範圍
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase