M

Modernce Base Sts

Developed by dleemiller
ModernBERT交叉编码器是一个高性能的语义相似度模型,专为评估文本相似度设计,支持长上下文处理。
Downloads 351
Release Time : 1/13/2025

Model Overview

该模型基于ModernBERT-base架构,通过交叉编码器方式比较两段文本的语义相似度,输出0-1的相似度分数。适用于评估大语言模型输出、文本匹配等场景。

Model Features

高性能
在STS-Benchmark测试集上达到皮尔逊系数0.9162和斯皮尔曼系数0.9122。
高效架构
基于ModernBERT-base设计(1.49亿参数),推理速度更快。
扩展的上下文长度
支持处理长达8192个标记的序列,非常适合评估LLM输出。
多样化训练
在dleemiller/wiki-sim上预训练,并在sentence-transformers/stsb上微调。

Model Capabilities

语义相似度计算
文本对比较
长文本处理

Use Cases

文本评估
大语言模型输出评估
评估大语言模型生成的文本与参考文本的语义相似度。
提供0-1的相似度分数,帮助量化模型输出质量。
文本匹配
比较两段文本的语义相似度,用于问答系统、信息检索等场景。
高准确度的相似度评分,提升匹配效果。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase