Q

Qwen3 Embedding 8B 4bit DWQ

由 mlx-community 开发
这是一个基于Qwen/Qwen3-Embedding-8B转换的4位DWQ量化版本,适用于MLX框架的嵌入模型。
下载量 213
发布时间 : 6/8/2025

模型简介

该模型主要用于文本嵌入和特征提取,能够将文本转换为高维向量表示,适用于文本相似度计算和信息检索等任务。

模型特点

4位DWQ量化
采用4位DWQ量化技术,显著减少模型大小和内存占用,同时保持较好的性能。
MLX框架支持
专为MLX框架优化,便于在支持MLX的硬件上部署和运行。
高效文本嵌入
能够高效地将文本转换为高维向量表示,适用于大规模文本处理任务。

模型能力

文本嵌入
特征提取
文本相似度计算
信息检索

使用案例

信息检索
文档相似度搜索
通过计算文档嵌入向量的相似度,实现高效的文档检索和推荐。
自然语言处理
语义搜索
利用文本嵌入实现基于语义的搜索功能,超越关键词匹配的限制。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase