J

Japanese Reranker Tiny V2

hotchpotchによって開発
これは非常にコンパクトで高速な日本語リランキングモデルで、RAGシステムの精度向上に適しており、CPUやエッジデバイス上でも効率的に動作します。
ダウンロード数 339
リリース時間 : 5/7/2025

モデル概要

このモデルは日本語テキストリランカーで、主に検索されたドキュメントを関連性の高い順に並べ替えるために使用されます。ModernBertアーキテクチャを基にしており、リソースが限られた環境での性能に特に最適化されています。

モデル特徴

軽量で効率的
わずか3層のアーキテクチャで、CPUやApple Silicon環境でも実用的な速度で動作
リソースフレンドリー
高価なGPUリソースを必要とせずにRAGシステムの精度を向上
エッジデバイス互換
エッジデバイスへの展開や遅延要件が厳しい本番環境に適しています
推論最適化
Flash Attention 2による高速化とONNX量子化最適化をサポート

モデル能力

日本語テキスト関連性スコアリング
検索結果のリランキング
高速推論

使用事例

情報検索
ドキュメント検索最適化
検索エンジンが返した結果を関連性の高い順に並べ替え
JQaRAデータセットで0.6455のスコアを達成
質問応答システム
QA候補回答のランキング
質問応答システムが生成した候補回答を関連性順に並べ替え
JSQuADデータセットで0.9608のスコアを達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase