S

Sentence Bert Base Ja Mean Tokens V2

由sonoisa開發
這是一個日語專用的Sentence-BERT模型,相比版本1採用了更優的損失函數進行訓練優化,準確率提升了1.5至2個百分點。
下載量 108.15k
發布時間 : 3/2/2022

模型概述

日語版Sentence-BERT模型,用於生成日語句子的嵌入向量,適用於句子相似度計算、特徵提取等任務。

模型特點

優化的損失函數
使用MultipleNegativesRankingLoss進行訓練,相比版本1準確率提升1.5-2%
日語專用
專門針對日語文本優化的Sentence-BERT模型
基於高質量預訓練模型
基於cl-tohoku/bert-base-japanese-whole-word-masking構建

模型能力

日語句子嵌入
句子相似度計算
特徵提取

使用案例

文本相似度
語義搜索
通過計算句子嵌入向量相似度實現語義搜索
重複內容檢測
識別不同表達但語義相似的句子
信息檢索
文檔聚類
基於句子嵌入對文檔進行聚類分析
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase