M

Modernce Large Sts

由dleemiller開發
高性能的語義相似度評估模型,專為文本比對任務優化
下載量 25
發布時間 : 1/13/2025

模型概述

該模型是基於ModernBERT-large架構的交叉編碼器,專門用於評估文本對的語義相似度,支持長文本處理並具有卓越的評估精度。

模型特點

卓越性能
在STS-Benchmark測試集上取得皮爾遜係數0.9256與斯皮爾曼係數0.9215
高效架構
基於ModernBERT-large設計,推理速度更快
長文本支持
支持最長8192個token的序列處理,特別適合大語言模型輸出評估
複合訓練
先通過wiki-sim數據集預訓練,再經stsb數據集微調

模型能力

語義相似度評估
文本對評分
長文本處理

使用案例

自然語言處理
大語言模型輸出評估
評估LLM生成文本與參考文本的語義相似度
提供0-1範圍的精確相似度評分
問答系統
判斷問題與候選答案的匹配程度
提高問答系統的準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase