U

USER Bge M3

由deepvk開發
俄語通用句子編碼器,基於sentence-transformers框架,專門為俄語文本提取1024維稠密向量
下載量 339.46k
發布時間 : 7/5/2024

模型概述

該模型能將俄語句子和段落映射到1024維稠密向量空間,適用於聚類或語義搜索等任務。基於bge-m3模型架構優化俄語處理能力。

模型特點

俄語優化
專門針對俄語文本進行優化訓練,在俄語語義理解任務上表現優異
多數據集訓練
融合ru-HNP、ru-WANLI等多個俄語數據集進行訓練
高性能向量編碼
生成1024維稠密向量,支持高效的相似度計算和聚類分析

模型能力

俄語文本向量化
語義相似度計算
文本聚類分析
特徵提取

使用案例

信息檢索
俄語語義搜索
構建俄語搜索引擎的語義匹配功能
在encodechka基準測試中平均得分0.799
文本分析
俄語文本聚類
對俄語新聞或社交媒體內容進行主題聚類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase