M

Modernce Base Sts

由dleemiller開發
ModernBERT交叉編碼器是一個高性能的語義相似度模型,專為評估文本相似度設計,支持長上下文處理。
下載量 351
發布時間 : 1/13/2025

模型概述

該模型基於ModernBERT-base架構,通過交叉編碼器方式比較兩段文本的語義相似度,輸出0-1的相似度分數。適用於評估大語言模型輸出、文本匹配等場景。

模型特點

高性能
在STS-Benchmark測試集上達到皮爾遜係數0.9162和斯皮爾曼係數0.9122。
高效架構
基於ModernBERT-base設計(1.49億參數),推理速度更快。
擴展的上下文長度
支持處理長達8192個標記的序列,非常適合評估LLM輸出。
多樣化訓練
在dleemiller/wiki-sim上預訓練,並在sentence-transformers/stsb上微調。

模型能力

語義相似度計算
文本對比較
長文本處理

使用案例

文本評估
大語言模型輸出評估
評估大語言模型生成的文本與參考文本的語義相似度。
提供0-1的相似度分數,幫助量化模型輸出質量。
文本匹配
比較兩段文本的語義相似度,用於問答系統、信息檢索等場景。
高準確度的相似度評分,提升匹配效果。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase