R

Ruropebert E5 Base 2k

由Tochka-AI開發
基於RoPEBert架構開發的俄語句子編碼器模型,支持2048標記上下文長度,在encodechka基準測試中表現優異。
下載量 2,422
發布時間 : 2/22/2024

模型概述

由Tochka AI開發的俄語句子嵌入模型,採用RoPEBert架構,主要用於俄語文本的特徵提取和句子相似度計算。

模型特點

長上下文支持
支持最長2048個標記的上下文處理,並可擴展至更長上下文
高效注意力機制
支持SDPA高效注意力實現,提升處理速度
RoPE縮放
支持linear和dynamic兩種RoPE縮放類型,可擴展模型上下文窗口
內置池化器
內置mean和first_token_transform兩種池化器實現,可直接獲取句子嵌入

模型能力

俄語文本特徵提取
句子相似度計算
文本分類
長文本處理

使用案例

文本相似度
句子相似度計算
計算俄語句子間的語義相似度
通過餘弦相似度得分衡量句子相似程度
文本分類
俄語文本分類
添加分類頭後可進行文本分類任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase