Qwen3 Reranker 0.6B W4A16 G128
Q

Qwen3 Reranker 0.6B W4A16 G128

boboliuによって開発
Qwen3-Reranker-0.6BのGPTQ量子化バージョンで、VRAM使用量を最適化し、精度損失が少ない
ダウンロード数 151
リリース時間 : 6/7/2025

モデル概要

これはQwen/Qwen3-Reranker-0.6Bに基づくGPTQ量子化モデルで、主にテキスト分類タスクに使用されます。量子化技術によりVRAM使用量を大幅に削減し、同時に高い精度を維持しています。

モデル特徴

VRAM最適化
VRAM使用量が3228Mから2124M(FA2なし)に減少し、リソース効率が大幅に向上します
精度保持
予想される精度損失は<5%で、実際のテストでは埋め込みモデルの精度損失は約0.7%のみです
高効率量子化
GPTQ量子化技術を使用し、Ultrachat、T2Ranking、COIG - CQIAをキャリブレーションセットとして使用します

モデル能力

テキスト分類
テキスト再並べ替え

使用事例

情報検索
検索結果の再並べ替え
検索エンジンが返した結果を再並べ替えして関連性を向上させます
テキスト処理
文書分類
大量の文書を自動的に分類します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase