M

Modernbert Embed Base Ft Sts Spanish Matryoshka 768 64

由 mrm8488 开发
这是一个基于modernbert-embed-base模型微调的句子转换器,用于生成句子嵌入向量并计算语义相似度。
下载量 443
发布时间 : 1/10/2025

模型简介

该模型能将句子和段落映射到768维密集向量空间,可用于语义文本相似度、语义搜索、复述挖掘、文本分类、聚类等任务。

模型特点

高维语义表示
能将文本映射到768维向量空间,捕捉深层语义特征
多维度相似度计算
支持不同维度(768/512/256/128/64)的语义相似度计算
长文本处理
最大序列长度达8192个标记,适合处理长文本
高效微调
在私有STS数据集上微调,提升语义相似度任务表现

模型能力

语义文本相似度计算
语义搜索
复述挖掘
文本分类
文本聚类

使用案例

信息检索
相似文档检索
通过计算文档向量相似度,实现相关文档检索
内容推荐
相关内容推荐
基于语义相似度为用户推荐相关内容
问答系统
相似问题匹配
在问答系统中匹配语义相似的问题
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase