Q

Qwq 32B Bnb 4bit

onekq-aiによって開発
QwQ-32Bの4ビット量子化バージョンで、Bitsandbytes技術を使用して最適化されており、リソースが制限された環境での効率的な推論に適しています
ダウンロード数 167
リリース時間 : 3/5/2025

モデル概要

Qwen/QwQ-32B大規模言語モデルを基にした4ビット量子化バージョンで、Bitsandbytes技術により効率的な推論を実現し、モデル性能を維持しながらVRAM要件を大幅に削減

モデル特徴

4ビット量子化
NF4量子化技術を使用し、モデルのVRAM使用量を大幅に削減
二重量子化
二重量子化戦略を採用してモデルサイズをさらに最適化
効率的な推論
モデル性能を維持しながら効率的な推論を実現
低リソース要件
VRAMが限られたデバイスでのデプロイに適しています

モデル能力

テキスト生成
テキスト理解
対話システム
コード生成

使用事例

自然言語処理
インテリジェント対話
チャットボットや仮想アシスタントの構築
流暢で自然な対話体験
コンテンツ作成
記事、ストーリー、詩の自動生成
高品質なクリエイティブテキスト出力
プログラミング支援
コード生成
自然言語記述に基づくコード生成
実行可能なコードスニペット
コード補完
プログラミング環境でのインテリジェントな補完提案
開発効率の向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase