M

Mmlw Roberta Base

由 sdadas 开发
基于RoBERTa架构的波兰语句子嵌入模型,专注于句子相似度计算和特征提取任务。
下载量 106.30k
发布时间 : 11/17/2023

模型简介

该模型是基于RoBERTa架构的波兰语预训练模型,主要用于句子相似度计算、特征提取和相关自然语言处理任务。在MTEB(Massive Text Embedding Benchmark)波兰语基准测试中展现了多项能力。

模型特点

波兰语优化
专门针对波兰语文本进行优化,在波兰语NLP任务中表现优异。
多功能句子嵌入
能够生成高质量的句子嵌入表示,适用于多种下游任务。
MTEB基准测试验证
在多个MTEB波兰语基准测试任务中进行了全面评估。

模型能力

句子相似度计算
文本特征提取
文本聚类
文本分类
信息检索
语义文本相似度评估

使用案例

文本分析
评论分类
对波兰语产品评论进行情感或主题分类
在AllegroReviews数据集上达到40.26%准确率
信息检索
文档检索
波兰语文档相似性搜索和检索
在DBPedia-PL数据集上达到25.24%的map@1000
语义分析
语义相似度评估
评估波兰语句子对的语义相似度
在CDSC-R数据集上达到92.55的Spearman相关系数
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase