S

Sup Simcse Ja Base

由cl-nagoya開發
基於監督式SimCSE方法微調的日語句子嵌入模型,適用於句子相似度計算和特徵提取任務。
下載量 3,027
發布時間 : 10/2/2023

模型概述

該模型是基於BERT架構的日語句子嵌入模型,通過監督式SimCSE方法在JSNLI數據集上微調,能夠生成高質量的句子嵌入表示,適用於句子相似度計算、信息檢索等自然語言處理任務。

模型特點

監督式SimCSE微調
採用監督式SimCSE方法進行微調,提升了句子嵌入的質量和區分度。
日語優化
基於日語BERT模型(cl-tohoku/bert-base-japanese-v3)構建,專門針對日語文本優化。
高效池化策略
採用CLS標記池化策略,訓練時額外添加MLP層,增強句子表示能力。

模型能力

句子嵌入生成
句子相似度計算
日語文本特徵提取
信息檢索

使用案例

自然語言處理
語義搜索
用於構建日語語義搜索引擎,根據查詢句子的語義相似度檢索相關文檔。
文本聚類
對日語文本進行聚類分析,發現相似內容或主題。
問答系統
作為問答系統的組件,用於匹配問題和相關知識片段。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase