R

Rubert Mini Frida

由sergeyzh開發
FRIDA模型的輕量快速修改版,用於計算俄語和英語句子的嵌入向量
下載量 1,203
發布時間 : 3/2/2025

模型概述

該模型通過將FRIDA(嵌入維度1536,24層)的嵌入蒸餾到rubert-mini-sts(嵌入維度312,7層)中實現,主要用於俄語和英語句子的嵌入計算及相似度比較。

模型特點

輕量高效
通過蒸餾技術大幅減小模型尺寸(從24層減至7層),同時保持較好的性能
多語言支持
同時支持俄語和英語的句子嵌入計算
前綴功能
繼承FRIDA的前綴功能,可通過不同前綴優化特定任務表現
均值池化
將FRIDA的CLS池化替換為均值池化,更適合句子相似度任務

模型能力

計算句子嵌入向量
俄語句子相似度比較
英語句子相似度比較
文本分類支持
信息檢索支持

使用案例

文本相似度
複述識別
識別兩個句子是否為相同意思的不同表達
在測試集上達到0.94的相似度分數
語義搜索
構建語義搜索引擎,匹配查詢與文檔
在新聞檢索任務NDCG@10達到0.721
分類任務
情感分析
對俄語文本進行情感傾向分類
在俄語評論分類任務中準確率0.658
主題分類
對俄語新聞進行主題分類
在新聞標題分類任務中準確率0.880
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase