M

Mmlw Roberta Base

由sdadas開發
基於RoBERTa架構的波蘭語句子嵌入模型,專注於句子相似度計算和特徵提取任務。
下載量 106.30k
發布時間 : 11/17/2023

模型概述

該模型是基於RoBERTa架構的波蘭語預訓練模型,主要用於句子相似度計算、特徵提取和相關自然語言處理任務。在MTEB(Massive Text Embedding Benchmark)波蘭語基準測試中展現了多項能力。

模型特點

波蘭語優化
專門針對波蘭語文本進行優化,在波蘭語NLP任務中表現優異。
多功能句子嵌入
能夠生成高質量的句子嵌入表示,適用於多種下游任務。
MTEB基準測試驗證
在多個MTEB波蘭語基準測試任務中進行了全面評估。

模型能力

句子相似度計算
文本特徵提取
文本聚類
文本分類
信息檢索
語義文本相似度評估

使用案例

文本分析
評論分類
對波蘭語產品評論進行情感或主題分類
在AllegroReviews數據集上達到40.26%準確率
信息檢索
文檔檢索
波蘭語文檔相似性搜索和檢索
在DBPedia-PL數據集上達到25.24%的map@1000
語義分析
語義相似度評估
評估波蘭語句子對的語義相似度
在CDSC-R數據集上達到92.55的Spearman相關係數
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase