R

Rubert Mini Frida

由 sergeyzh 开发
FRIDA模型的轻量快速修改版,用于计算俄语和英语句子的嵌入向量
下载量 1,203
发布时间 : 3/2/2025

模型简介

该模型通过将FRIDA(嵌入维度1536,24层)的嵌入蒸馏到rubert-mini-sts(嵌入维度312,7层)中实现,主要用于俄语和英语句子的嵌入计算及相似度比较。

模型特点

轻量高效
通过蒸馏技术大幅减小模型尺寸(从24层减至7层),同时保持较好的性能
多语言支持
同时支持俄语和英语的句子嵌入计算
前缀功能
继承FRIDA的前缀功能,可通过不同前缀优化特定任务表现
均值池化
将FRIDA的CLS池化替换为均值池化,更适合句子相似度任务

模型能力

计算句子嵌入向量
俄语句子相似度比较
英语句子相似度比较
文本分类支持
信息检索支持

使用案例

文本相似度
复述识别
识别两个句子是否为相同意思的不同表达
在测试集上达到0.94的相似度分数
语义搜索
构建语义搜索引擎,匹配查询与文档
在新闻检索任务NDCG@10达到0.721
分类任务
情感分析
对俄语文本进行情感倾向分类
在俄语评论分类任务中准确率0.658
主题分类
对俄语新闻进行主题分类
在新闻标题分类任务中准确率0.880
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase