G

Gte Base Ko

juyoungmlによって開発
Alibaba-NLP/gte-multilingual-baseモデルを韓国語のトリプレットデータセットでファインチューニングした文埋め込みモデルで、意味的類似度計算に使用されます
ダウンロード数 18
リリース時間 : 11/17/2024

モデル概要

これはAlibaba-NLP/gte-multilingual-baseモデルを基に、韓国語のトリプレットデータセットnlpai-lab/ko-triplet-v1.0でファインチューニングした文変換モデルです。文や段落を768次元の密なベクトル空間にマッピングし、意味的テキスト類似性、意味的検索、テキスト分類などのタスクに使用できます。

モデル特徴

韓国語最適化
韓国語テキストに特化して最適化されており、韓国語トリプレットデータセットでファインチューニングされています
長文サポート
最大8192トークンのシーケンス長をサポートし、長文処理に適しています
高精度
評価データセットで98.55%のコサイン精度を達成しています

モデル能力

意味的テキスト類似度計算
意味的検索
テキスト分類
クラスタリング分析
特徴抽出

使用事例

情報検索
類似文書検索
クエリテキストに基づいて意味的に類似した文書を検索します
テキスト分析
テキストクラスタリング
意味的に類似したテキストを自動的にグループ化します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase