S

Sbert Uncased Finnish Paraphrase

由TurkuNLP開發
基於FinBERT訓練的芬蘭語句子BERT模型,用於句子相似度計算和特徵提取
下載量 895
發布時間 : 3/2/2022

模型概述

這是一個基於FinBERT訓練的句子轉換器模型,專門用於芬蘭語的句子相似度計算和特徵提取。模型通過均值池化處理句子嵌入,適用於釋義識別等任務。

模型特點

無大小寫區分
模型對大小寫不敏感,適合處理不同大小寫形式的芬蘭語文本
高質量芬蘭語訓練
基於芬蘭語釋義語料庫和自動收集的釋義候選句訓練(50萬正例,500萬負例)
高效句子嵌入
使用均值池化方法生成高質量的句子級嵌入表示

模型能力

句子特徵提取
句子相似度計算
語義相似度比較
芬蘭語文本處理

使用案例

文本相似度
釋義識別
識別兩個芬蘭語句子是否為釋義關係
在芬蘭語釋義語料庫上表現良好
語義搜索
從大規模文本中檢索語義相似的句子
可用於構建400萬句子的語義檢索系統
特徵提取
句子嵌入生成
為下游任務生成句子級別的特徵表示
生成768維的句子嵌入向量
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase