DeepSeek-R1-0528-Qwen3-8B-6bit開源文本生成模型

首頁

Deepseek R1 0528 Qwen3 8B 6bit

由mlx-community開發

基於DeepSeek-R1-0528-Qwen3-8B模型轉換的6位量化版本，適用於MLX框架的文本生成任務。

大型語言模型開源協議:MIT #6bit量化 #MLX格式 #中文文本生成

下載量 582

發布時間 : 6/6/2025

模型概述

這是一個經過6位量化的文本生成模型，基於DeepSeek-R1-0528-Qwen3-8B轉換而來，專為MLX框架優化，適用於各種自然語言處理任務。

模型特點

6位量化

模型經過6位量化處理，在保持性能的同時減少內存佔用

MLX優化

專為MLX框架轉換，可在蘋果芯片上高效運行

聊天模板支持

內置聊天模板功能，便於構建對話系統

模型能力

文本生成

對話系統構建

自然語言理解

使用案例

對話系統

智能客服

構建自動客服系統，處理用戶諮詢

可生成自然流暢的客服響應

個人助手

開發個性化AI助手

能夠理解並回應用戶需求

內容創作

文本生成

自動生成文章、故事等內容

可生成連貫、有邏輯的文本

屬性	詳情
模型類型	文本生成
基礎模型	deepseek-ai/DeepSeek-R1-0528-Qwen3-8B
標籤	mlx
任務類型	文本生成

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Deepseek R1 0528 Qwen3 8B 6bit

模型概述

模型特點

模型能力

使用案例

🚀 mlx-community/DeepSeek-R1-0528-Qwen3-8B-6bit

🚀 快速開始

📦 安裝指南

💻 使用示例

基礎用法

📄 許可證