S

Simcse Indobert Base

LazarusNLPによって開発
IndoBERTベースのSimCSEモデル、インドネシア語文の意味的埋め込みベクトル生成用
ダウンロード数 26
リリース時間 : 5/27/2023

モデル概要

これはsentence-transformersベースのモデルで、インドネシア語の文や段落を768次元の密なベクトル空間にマッピングでき、クラスタリングや意味検索などのタスクに使用可能です。

モデル特徴

インドネシア語専用
インドネシア語に特化して最適化された文埋め込みモデル
高次元意味空間
文を768次元の密なベクトル空間にマッピング
SimCSE訓練
対照学習(SimCSE)手法で訓練され、文表現の品質を向上

モデル能力

文埋め込み生成
意味的類似度計算
テキストクラスタリング
意味検索

使用事例

情報検索
類似文書検索
インドネシア語文書コレクションから意味的に類似した文書を検索
テキスト分析
トピッククラスタリング
インドネシア語テキストを意味ベースでトピッククラスタリング分析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase