Qwen3-Embedding-8B-4bit-DWQ开源嵌入模型

首页

Qwen3 Embedding 8B 4bit DWQ

由 mlx-community 开发

这是一个基于Qwen/Qwen3-Embedding-8B转换的4位DWQ量化版本，适用于MLX框架的嵌入模型。

文本嵌入开源协议:Apache-2.0 #4bit量化嵌入 #大模型文本嵌入 #高维向量生成

下载量 213

发布时间 : 6/8/2025

模型简介

该模型主要用于文本嵌入和特征提取，能够将文本转换为高维向量表示，适用于文本相似度计算和信息检索等任务。

模型特点

4位DWQ量化

采用4位DWQ量化技术，显著减少模型大小和内存占用，同时保持较好的性能。

MLX框架支持

专为MLX框架优化，便于在支持MLX的硬件上部署和运行。

高效文本嵌入

能够高效地将文本转换为高维向量表示，适用于大规模文本处理任务。

模型能力

文本嵌入

特征提取

文本相似度计算

信息检索

使用案例

信息检索

文档相似度搜索

通过计算文档嵌入向量的相似度，实现高效的文档检索和推荐。

自然语言处理

语义搜索

利用文本嵌入实现基于语义的搜索功能，超越关键词匹配的限制。

属性	详情
基础模型	Qwen/Qwen3-Embedding-8B
库名称	mlx
管道标签	文本生成
标签	transformers、sentence-transformers、sentence-similarity、feature-extraction、mlx

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Qwen3 Embedding 8B 4bit DWQ

模型简介

模型特点

模型能力

使用案例

🚀 mlx-community/Qwen3-Embedding-8B-4bit-DWQ

🚀 快速开始

📦 安装指南

💻 使用示例

基础用法

📄 许可证