M

Modernbert Embed Base Ft Sts Spanish Matryoshka 768 64

Developed by mrm8488
這是一個基於modernbert-embed-base模型微調的句子轉換器,用於生成句子嵌入向量並計算語義相似度。
Downloads 443
Release Time : 1/10/2025

Model Overview

該模型能將句子和段落映射到768維密集向量空間,可用於語義文本相似度、語義搜索、複述挖掘、文本分類、聚類等任務。

Model Features

高維語義表示
能將文本映射到768維向量空間,捕捉深層語義特徵
多維度相似度計算
支持不同維度(768/512/256/128/64)的語義相似度計算
長文本處理
最大序列長度達8192個標記,適合處理長文本
高效微調
在私有STS數據集上微調,提升語義相似度任務表現

Model Capabilities

語義文本相似度計算
語義搜索
複述挖掘
文本分類
文本聚類

Use Cases

信息檢索
相似文檔檢索
通過計算文檔向量相似度,實現相關文檔檢索
內容推薦
相關內容推薦
基於語義相似度為用戶推薦相關內容
問答系統
相似問題匹配
在問答系統中匹配語義相似的問題
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase