Q

Qwen3 Embedding 0.6B Onnx Uint8

由electroglyph開發
這是一個基於ONNX的量化模型,是Qwen/Qwen3-Embedding-0.6B的uint8量化版本,在保持檢索性能的同時減少了模型大小。
下載量 112
發布時間 : 6/8/2025

模型概述

該模型是一個文本嵌入模型,用於生成文本的向量表示,適用於信息檢索、語義搜索等任務。

模型特點

高效量化
採用uint8量化技術,顯著減少模型大小,同時保持檢索性能。
高性能
與完整f32模型相比,檢索性能差異僅約1%。
兼容性
與qdrant fastembed兼容,便於在相關環境中部署使用。
優化量化策略
通過排除484個敏感節點不進行量化,在模型大小和準確率之間取得良好平衡。

模型能力

文本向量化
語義搜索
信息檢索

使用案例

信息檢索
文檔搜索
將文檔轉換為向量表示,實現基於語義的文檔搜索。
推薦系統
內容推薦
通過內容向量相似度實現個性化推薦。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase