D

Deepseek R1 AWQ

cognitivecomputationsによって開発
DeepSeek R1モデルのAWQ量子化バージョン、float16オーバーフロー問題を最適化し、効率的な推論デプロイをサポート
ダウンロード数 30.46k
リリース時間 : 1/21/2025

モデル概要

DeepSeek-R1ベースモデルのAWQ量子化バージョン、テキスト生成タスクに適し、中英処理をサポート

モデル特徴

効率的な量子化
AWQ量子化技術を採用、モデル性能を維持しながら計算リソース要件を大幅に削減
オーバーフロー修正
モデルコードを修正、float16使用時のオーバーフロー問題を修正
高性能デプロイ
vLLMによる効率的なデプロイをサポート、複数GPU構成下の性能ベンチマークを提供

モデル能力

テキスト生成
中英処理
長文脈推論

使用事例

テキスト生成
コンテンツ作成
様々なタイプのテキストコンテンツを生成
対話システム
インテリジェントな対話エージェントを構築
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase