R

Ruropebert Classic Base 512

由 Tochka-AI 开发
基于RoPEBert架构开发的俄语编码器模型,采用克隆方法训练,支持512个token的上下文,在质量上超越原始ruBert-base模型
下载量 103
发布时间 : 2/22/2024

模型简介

这是一个针对俄语优化的文本编码器模型,主要用于文本特征提取和分类任务,基于改进的RoPEBert架构开发

模型特点

RoPE架构改进
采用Rotary Position Embedding(RoPE)技术改进的Bert架构,提供更好的位置编码效果
长上下文支持
原生支持512个token的上下文,可通过RoPE缩放扩展至更长文本处理
高效注意力机制
支持SDPA高效注意力实现,提升计算效率
内置池化器
提供mean和first_token_transform两种池化方式,方便获取文本嵌入向量

模型能力

文本特征提取
文本相似度计算
文本分类
长文本处理

使用案例

语义理解
文本相似度计算
计算两段俄语文本的语义相似度
通过归一化嵌入向量和矩阵乘法实现
文本分类
情感分析
对俄语文本进行情感倾向分类
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase