R

Rubert Mini Uncased

由sergeyzh開發
該模型用於計算俄語和英語句子的嵌入向量,通過蒸餾ai-forever/FRIDA的嵌入向量獲得。模型屬於uncased類型,不區分文本中的大小寫字母。
下載量 724
發布時間 : 3/25/2025

模型概述

該模型用於計算俄語和英語句子的嵌入向量,通過蒸餾FRIDA的嵌入向量獲得。嵌入向量大小為384,層數為7,上下文大小為512個標記。模型支持多種前綴功能以提高不同任務的性能。

模型特點

多語言支持
支持俄語和英語句子的嵌入向量計算
前綴功能
繼承自FRIDA的多任務前綴功能,可針對不同任務優化性能
微型模型
輕量級設計,嵌入向量大小為384,層數為7,適合資源有限的環境
不區分大小寫
uncased類型,不區分文本中的大小寫字母

模型能力

計算句子嵌入向量
語義文本相似度計算
複述識別
自然語言推理
情感分析
毒性識別

使用案例

文本相似度
搜索查詢匹配
使用search_query前綴優化搜索查詢與文檔的匹配
在ruMTEB基準測試中NDCG@10得分為0.791
複述識別
使用paraphrase前綴識別語義相似的句子
在複述識別任務中得分為0.760
文本分類
情感分析
使用categorize_sentiment前綴進行情感分類
在情感分析任務中得分為0.798
主題分類
使用categorize_topic前綴進行主題分類
在標題分類任務中準確率達0.884
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase