S

Simcse Indobert Base

Developed by LazarusNLP
基于IndoBERT的SimCSE模型,用于生成印尼语句子的语义嵌入向量
Downloads 26
Release Time : 5/27/2023

Model Overview

这是一个基于sentence-transformers的模型,能够将印尼语的句子和段落映射到768维的密集向量空间,可用于聚类或语义搜索等任务。

Model Features

印尼语专用
专门针对印尼语优化的句子嵌入模型
高维语义空间
将句子映射到768维的密集向量空间
SimCSE训练
使用对比学习(SimCSE)方法训练,提升句子表示质量

Model Capabilities

句子嵌入生成
语义相似度计算
文本聚类
语义搜索

Use Cases

信息检索
相似文档检索
在印尼语文档集合中查找语义相似的文档
文本分析
主题聚类
对印尼语文本进行基于语义的主题聚类分析
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase