Q

Qwen3 Embedding 8B W4A16 G128

由 boboliu 开发
Qwen3-Embedding-8B的GPTQ量化版本,显著降低显存需求同时保持高性能
下载量 322
发布时间 : 6/6/2025

模型简介

基于Qwen3-Embedding-8B的4-bit量化模型,用于文本嵌入任务,在保持较高性能的同时大幅降低显存需求

模型特点

显存优化
显存使用从24G降至19624M,可在3090/4090显卡上运行
性能保留
C-MTEB测试中性能损失仅0.81%,量化后仍保持高水平
高效量化
采用W4A16(4-bit权重,16-bit激活)量化方案

模型能力

文本向量化
语义相似度计算
信息检索
文本分类
文本聚类

使用案例

信息检索
文档搜索
将查询和文档转换为向量进行相似度匹配
在检索任务中获得77.39的得分
文本分类
多类别分类
利用嵌入向量进行文本分类
在分类任务中获得76.85的得分
语义分析
语义相似度计算
计算文本对之间的语义相似度
在STS任务中获得62.80的得分
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase