J

Japanese Reranker Tiny V2

Developed by hotchpotch
これは非常にコンパクトで高速な日本語リランキングモデルで、RAGシステムの精度向上に適しており、CPUやエッジデバイス上でも効率的に動作します。
Downloads 339
Release Time : 5/7/2025

Model Overview

このモデルは日本語テキストリランカーで、主に検索されたドキュメントを関連性の高い順に並べ替えるために使用されます。ModernBertアーキテクチャを基にしており、リソースが限られた環境での性能に特に最適化されています。

Model Features

軽量で効率的
わずか3層のアーキテクチャで、CPUやApple Silicon環境でも実用的な速度で動作
リソースフレンドリー
高価なGPUリソースを必要とせずにRAGシステムの精度を向上
エッジデバイス互換
エッジデバイスへの展開や遅延要件が厳しい本番環境に適しています
推論最適化
Flash Attention 2による高速化とONNX量子化最適化をサポート

Model Capabilities

日本語テキスト関連性スコアリング
検索結果のリランキング
高速推論

Use Cases

情報検索
ドキュメント検索最適化
検索エンジンが返した結果を関連性の高い順に並べ替え
JQaRAデータセットで0.6455のスコアを達成
質問応答システム
QA候補回答のランキング
質問応答システムが生成した候補回答を関連性順に並べ替え
JSQuADデータセットで0.9608のスコアを達成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase