Qwen3 Reranker 0.6B W4A16 G128
Q

Qwen3 Reranker 0.6B W4A16 G128

由boboliu開發
Qwen3-Reranker-0.6B的GPTQ量化版本,顯存使用優化且精度損失小
下載量 151
發布時間 : 6/7/2025

模型概述

這是一個基於Qwen/Qwen3-Reranker-0.6B的GPTQ量化模型,主要用於文本分類任務。通過量化技術顯著降低了顯存使用量,同時保持了較高的精度。

模型特點

顯存優化
顯存使用量從3228M降至2124M(無FA2),顯著提升資源效率
精度保留
預計精度損失<5%,實際測試顯示嵌入模型精度損失僅約0.7%
高效量化
使用GPTQ量化技術,結合Ultrachat、T2Ranking和COIG-CQIA作為校準集

模型能力

文本分類
文本重排序

使用案例

信息檢索
搜索結果重排序
對搜索引擎返回的結果進行重新排序以提高相關性
文本處理
文檔分類
對大量文檔進行自動分類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase