D

Dewey En Beta

由infgrad開發
杜威是一種新型的長上下文嵌入模型,基於ModernBERT架構,支持128k上下文窗口,在長文檔檢索任務中表現優異。
下載量 447
發布時間 : 3/23/2025

模型概述

杜威模型專注於提升長文檔場景下的檢索性能,採用指令式訓練方法使嵌入與任務對齊,支持單向量和多向量表示,具有靈活的文本分塊機制。

模型特點

超長上下文支持
支持128k tokens的超長上下文處理能力
多向量表示
支持類似Colbert的多向量表示,但向量數量更少(僅為token數的0.5%)
高效編碼
受益於ModernBERT架構優勢,即使在長文本編碼時也能保持高效
靈活分塊
支持完全自定義的文本分塊策略,可適應不同應用場景

模型能力

長文檔檢索
語義相似度計算
文本分類
文本聚類

使用案例

信息檢索
長文檔檢索
在包含超長文檔的數據庫中進行高效檢索
在LongEmbed基準測試中取得0.86分,超越多個商業模型
語義分析
語義相似度計算
計算文本之間的語義相似度
在短文本評估(MTEB-eng-v2)中表現優異,超越多個7B規模模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase