Deepseek R1 0528 Qwen3 8B AWQ 4bit

D

Deepseek R1 0528 Qwen3 8B AWQ 4bit

由 hxac 开发

DeepSeek-R1-0528-Qwen3-8B的AWQ量化版本，适用于特定场景下的高效推理。

大型语言模型

开源协议:MIT #AWQ量化 #8B参数规模 #高效推理

下载量 179

发布时间 : 5/30/2025

模型简介

该项目提供了DeepSeek-R1-0528-Qwen3-8B模型的AWQ量化版本，旨在优化模型在特定硬件上的推理效率。

模型特点

AWQ量化

通过AWQ量化技术优化模型，提升推理效率，适用于资源受限的环境。

高效推理

量化后的模型在保持较高性能的同时，显著降低计算资源需求。

模型能力

文本生成

自然语言理解

使用案例

文本生成

内容创作

用于自动生成文章、故事或其他文本内容。

生成流畅、连贯的文本

对话系统

用于构建智能对话机器人，提供自然语言交互。

生成自然、上下文相关的回复

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase