U

USER Base

由deepvk開發
專為俄語設計的句子嵌入提取模型,可將句子和段落映射到768維稠密向量空間,適用於聚類或語義搜索等任務。
下載量 2,337
發布時間 : 6/10/2024

模型概述

USER是基於sentence-transformers的俄語通用句子編碼器,專門針對俄語訓練,適用於各種自然語言處理任務。

模型特點

俄語優化
專門針對俄語訓練,在俄語任務上表現優異
多階段訓練
採用兩階段訓練流程,結合對比預訓練和模型融合技術
提示詞優化
通過query和passage提示詞區分不同任務類型
輕量高效
僅85M參數,在同規模模型中表現最優

模型能力

句子嵌入提取
語義相似度計算
文本聚類
信息檢索
特徵提取

使用案例

信息檢索
問答系統
用於匹配用戶查詢與相關文檔段落
在MIRACL數據集上達到0.763的召回率@100
文本分析
語義相似度計算
計算兩個句子或段落之間的語義相似度
在Encodechka基準上平均得分0.772
文本聚類
將相似內容的文本自動分組
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase