Q

Qwen3 Embedding 0.6B Onnx Uint8

由 electroglyph 开发
这是一个基于ONNX的量化模型,是Qwen/Qwen3-Embedding-0.6B的uint8量化版本,在保持检索性能的同时减少了模型大小。
下载量 112
发布时间 : 6/8/2025

模型简介

该模型是一个文本嵌入模型,用于生成文本的向量表示,适用于信息检索、语义搜索等任务。

模型特点

高效量化
采用uint8量化技术,显著减少模型大小,同时保持检索性能。
高性能
与完整f32模型相比,检索性能差异仅约1%。
兼容性
与qdrant fastembed兼容,便于在相关环境中部署使用。
优化量化策略
通过排除484个敏感节点不进行量化,在模型大小和准确率之间取得良好平衡。

模型能力

文本向量化
语义搜索
信息检索

使用案例

信息检索
文档搜索
将文档转换为向量表示,实现基于语义的文档搜索。
推荐系统
内容推荐
通过内容向量相似度实现个性化推荐。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase