G

Gte Modernbert Base

由Alibaba-NLP開發
基於ModernBERT預訓練編碼器的文本嵌入模型,支持8192 tokens長文本處理,在MTEB、LoCO和COIR等評估任務中表現優異。
下載量 74.52k
發布時間 : 1/20/2025

模型概述

該模型是阿里巴巴集團通義實驗室開發的文本嵌入模型,專注於英語文本處理,適用於信息檢索、語義相似度計算等任務。

模型特點

長文本處理能力
支持最大8192 tokens的輸入長度,適合處理長文檔
高效性能
支持Flash Attention 2加速,在GPU上運行效率高
多場景適用
在MTEB、LoCO和COIR等多種評估任務中表現優異

模型能力

文本嵌入
語義相似度計算
信息檢索
長文檔處理

使用案例

信息檢索
文檔檢索
在大規模文檔庫中快速檢索相關內容
在LoCO評估中NDCG@10達到88.88
語義相似度
問答匹配
計算問題與候選答案的語義相似度
在MTEB語義相似度任務中得分81.57
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase