G

Glucose Base Ja V2

Developed by pkshatech
汎用日本語テキスト埋め込みモデル、検索タスクに最適化され、CPU上で優れた性能を発揮
Downloads 25.25k
Release Time : 8/22/2024

Model Overview

日本語テキスト処理に特化した汎用埋め込みモデルで、特に検索タスクと文類似度計算に優れており、クエリベースの段落検索システムとして使用可能

Model Features

検索タスク最適化
MIRACLなどの検索タスクで同サイズモデル中最も高い性能を発揮
日本語専用最適化
日本語テキスト処理に特化して最適化訓練
軽量高效
CPU実行をサポートし、リソース制限環境に適している
多段階訓練
統合蒸留と多段階対照学習による微調整

Model Capabilities

文類似度計算
意味検索
特徴抽出
段落検索

Use Cases

情報検索
企業ナレッジベース検索
企業内部ナレッジベースの意味検索システム
MIRACL-jaデータセットで85.5のRecall@5を達成
質問応答システム
検索ベースの質問応答システム構築
JQaRAデータセットで60.6のnDCG@10を達成
テキスト分析
テキストクラスタリング
日本語テキストの意味クラスタリング分析
意味類似度計算
文間の意味類似度を計算
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase