R

Rubert Tiny2

由cointegrated開發
基於BERT的小型俄語編碼器,能生成高質量的句子嵌入向量
下載量 585.48k
發布時間 : 3/2/2022

模型概述

這是rubert-tiny的升級版本,專注於俄語處理,可用於生成句子嵌入向量或針對下游任務進行微調。

模型特點

擴展詞彙表
詞彙表從29564個詞元擴展到83828個,提高了模型的表現力
長序列支持
支持的最大序列長度從512擴展到2048
高質量句子嵌入
句子嵌入向量更接近LaBSE的表現
優化片段嵌入
在NLI任務上進行了調優,具有實際意義的片段嵌入
專注俄語處理
該模型專門針對俄語優化

模型能力

生成句子嵌入向量
短文本分類
句子相似度計算
填充掩碼

使用案例

文本處理
短文本分類
使用KNN等方法對短文本進行分類
語義搜索
基於句子嵌入向量進行語義相似性搜索
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase