M

Modernbert Embed Base Ft Sts Spanish Matryoshka 768 64

由mrm8488開發
這是一個基於modernbert-embed-base模型微調的句子轉換器,用於生成句子嵌入向量並計算語義相似度。
下載量 443
發布時間 : 1/10/2025

模型概述

該模型能將句子和段落映射到768維密集向量空間,可用於語義文本相似度、語義搜索、複述挖掘、文本分類、聚類等任務。

模型特點

高維語義表示
能將文本映射到768維向量空間,捕捉深層語義特徵
多維度相似度計算
支持不同維度(768/512/256/128/64)的語義相似度計算
長文本處理
最大序列長度達8192個標記,適合處理長文本
高效微調
在私有STS數據集上微調,提升語義相似度任務表現

模型能力

語義文本相似度計算
語義搜索
複述挖掘
文本分類
文本聚類

使用案例

信息檢索
相似文檔檢索
通過計算文檔向量相似度,實現相關文檔檢索
內容推薦
相關內容推薦
基於語義相似度為用戶推薦相關內容
問答系統
相似問題匹配
在問答系統中匹配語義相似的問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase