Q

Qwen3 Embedding 8B W4A16 G128

Developed by boboliu
Qwen3-Embedding-8B的GPTQ量化版本,顯著降低顯存需求同時保持高性能
Downloads 322
Release Time : 6/6/2025

Model Overview

基於Qwen3-Embedding-8B的4-bit量化模型,用於文本嵌入任務,在保持較高性能的同時大幅降低顯存需求

Model Features

顯存優化
顯存使用從24G降至19624M,可在3090/4090顯卡上運行
性能保留
C-MTEB測試中性能損失僅0.81%,量化後仍保持高水平
高效量化
採用W4A16(4-bit權重,16-bit激活)量化方案

Model Capabilities

文本向量化
語義相似度計算
信息檢索
文本分類
文本聚類

Use Cases

信息檢索
文檔搜索
將查詢和文檔轉換為向量進行相似度匹配
在檢索任務中獲得77.39的得分
文本分類
多類別分類
利用嵌入向量進行文本分類
在分類任務中獲得76.85的得分
語義分析
語義相似度計算
計算文本對之間的語義相似度
在STS任務中獲得62.80的得分
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase