S

Sup Simcse Ja Large

由cl-nagoya開發
這是一個基於監督式SimCSE方法訓練的日語句子嵌入模型,專門用於生成高質量的句子表示。
下載量 2,315
發布時間 : 10/2/2023

模型概述

該模型通過監督式SimCSE方法在JSNLI數據集上微調,能夠將日語句子轉換為高維向量表示,適用於句子相似度計算等任務。

模型特點

監督式SimCSE訓練
採用監督式SimCSE方法進行訓練,利用JSNLI數據集中的自然語言推理標籤來優化句子表示。
高質量日語嵌入
專門針對日語文本優化,能夠生成高質量的句子嵌入向量。
大模型容量
基於BERT-large架構,具有更強的表示能力。

模型能力

日語文本嵌入
句子相似度計算
語義搜索

使用案例

信息檢索
語義搜索
使用句子嵌入進行語義相似度搜索
能夠找到語義相似但不一定包含相同關鍵詞的文檔
文本分析
文本聚類
基於句子嵌入對相似文本進行聚類
可以識別語義相似的文本組
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase