N

Nomic Embed Text V2 Moe

由nomic-ai開發
Nomic Embed v2 是一款高性能多語言專家混合(MoE)文本嵌入模型,支持約100種語言,在多語言檢索任務中表現卓越。
下載量 242.32k
發布時間 : 2/7/2025

模型概述

該模型採用專家混合架構,結合套娃嵌入技術,提供靈活的嵌入維度選擇,在多語言文本相似度和檢索任務中達到領先水平。

模型特點

多語言專家混合架構
採用8專家混合架構,在保持高效推理的同時提升多語言性能
套娃嵌入技術
支持從768到256維的靈活嵌入維度選擇,顯著降低存儲成本
廣泛語言支持
支持約100種語言,訓練數據超過16億對
開源透明
完全開源模型權重、訓練代碼和訓練數據

模型能力

多語言文本嵌入
句子相似度計算
特徵提取
跨語言檢索

使用案例

信息檢索
跨語言文檔檢索
在不同語言文檔間建立語義關聯,實現跨語言搜索
在MIRACL基準測試中達到65.80分
語義分析
多語言文本相似度計算
計算不同語言文本之間的語義相似度
支持約100種語言的相似度分析
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase