S

Simcse Indobert Base

由LazarusNLP開發
基於IndoBERT的SimCSE模型,用於生成印尼語句子的語義嵌入向量
下載量 26
發布時間 : 5/27/2023

模型概述

這是一個基於sentence-transformers的模型,能夠將印尼語的句子和段落映射到768維的密集向量空間,可用於聚類或語義搜索等任務。

模型特點

印尼語專用
專門針對印尼語優化的句子嵌入模型
高維語義空間
將句子映射到768維的密集向量空間
SimCSE訓練
使用對比學習(SimCSE)方法訓練,提升句子表示質量

模型能力

句子嵌入生成
語義相似度計算
文本聚類
語義搜索

使用案例

信息檢索
相似文檔檢索
在印尼語文檔集合中查找語義相似的文檔
文本分析
主題聚類
對印尼語文本進行基於語義的主題聚類分析
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase