Q

Qwen3 Reranker 4B W4A16 G128

Developed by boboliu
これはQwen/Qwen3-Reranker-4BをGPTQ量子化した成果で、VRAM使用量を大幅に削減しました。
Downloads 157
Release Time : 6/7/2025

Model Overview

Qwen3-Reranker-4Bに基づく量子化バージョンで、主にテキスト分類タスクに使用され、GPTQ量子化技術によりVRAM使用効率が最適化されています。

Model Features

VRAM最適化
VRAM使用量が17430Mから11000M(FA2を使用しない場合)に削減され、リソース効率が大幅に向上しました。
精度維持
VRAM使用量を大幅に削減しながら、予想される正解率の損失は<5%で、Embeddingバージョンでは約0.7%の損失のみが見られます。
量子化技術
GPTQ量子化技術(W4A16 - G128構成)を採用し、モデルの圧縮と高速化を実現しました。

Model Capabilities

テキスト再ランキング
テキスト関連性スコアリング
情報検索最適化

Use Cases

情報検索
検索エンジン結果の最適化
検索エンジンが返す結果を再ランキングし、関連性を向上させます。
検索結果の関連性ランキングを向上させます。
レコメンドシステム
レコメンドコンテンツのランキング
レコメンドシステムが生成したコンテンツリストを最適化してランキングします。
レコメンドコンテンツの関連性とユーザー満足度を向上させます。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase