DeepSeek-R1-Distill-Qwen-32B-4bitオープンソースモデル - Appleチップ搭載デバイスでの高効率推論に最適

ホーム

Deepseek R1 Distill Qwen 32B 4bit

mlx-communityによって開発

これはDeepSeek-R1-Distill-Qwen-32BモデルのMLX 4ビット量子化バージョンで、Appleチップデバイス向けの効率的な推論に適しています

大規模言語モデル

Transformers

#蒸留大規模モデル #4ビット量子化 #中国語対話

ダウンロード数 130.79k

リリース時間 : 1/21/2025

モデル概要

Qwen-32Bを基に蒸留最適化された32Bパラメータの大規模言語モデルで、4ビット量子化変換を経てMLXフレームワークで動作可能

モデル特徴

MLX最適化

Appleチップ向けに最適化された4ビット量子化バージョンで、Macデバイスで効率的に動作

蒸留モデル

Qwen-32Bを基にした蒸留バージョンで、性能を維持しつつ推論効率を向上

中国語最適化

中国語テキスト処理に特化した最適化を実施

モデル能力

テキスト生成

対話インタラクション

知識質問応答

テキスト要約

使用事例

インテリジェントアシスタント

チャットボット

中国語対話アシスタントの構築

流暢な中国語対話体験

コンテンツ生成

記事作成

中国語コンテンツ作成の補助

一貫性のある中国語テキスト生成

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Deepseek R1 Distill Qwen 32B 4bit

モデル概要

モデル特徴

モデル能力

使用事例

🚀 mlx-community/DeepSeek-R1-Distill-Qwen-32B-4bit

🚀 クイックスタート

📦 インストール

💻 使用例

基本的な使用法