S

Sbert Uncased Finnish Paraphrase

Developed by TurkuNLP
基于FinBERT训练的芬兰语句子BERT模型,用于句子相似度计算和特征提取
Downloads 895
Release Time : 3/2/2022

Model Overview

这是一个基于FinBERT训练的句子转换器模型,专门用于芬兰语的句子相似度计算和特征提取。模型通过均值池化处理句子嵌入,适用于释义识别等任务。

Model Features

无大小写区分
模型对大小写不敏感,适合处理不同大小写形式的芬兰语文本
高质量芬兰语训练
基于芬兰语释义语料库和自动收集的释义候选句训练(50万正例,500万负例)
高效句子嵌入
使用均值池化方法生成高质量的句子级嵌入表示

Model Capabilities

句子特征提取
句子相似度计算
语义相似度比较
芬兰语文本处理

Use Cases

文本相似度
释义识别
识别两个芬兰语句子是否为释义关系
在芬兰语释义语料库上表现良好
语义搜索
从大规模文本中检索语义相似的句子
可用于构建400万句子的语义检索系统
特征提取
句子嵌入生成
为下游任务生成句子级别的特征表示
生成768维的句子嵌入向量
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase