Q

Qwen3 4B GGUF

ZeroWwによって開発
量子化されたテキスト生成モデルで、出力と埋め込みテンソルはf16形式、その他のテンソルはq5_kまたはq6_k量子化されており、体積が小さく純粋なf16バージョンと同等の性能を維持しています。
ダウンロード数 495
リリース時間 : 4/29/2025

モデル概要

このモデルは量子化バージョンのテキスト生成モデルで、テンソル形式を最適化することでモデルの体積を削減しつつ、オリジナルバージョンと同等の性能を維持しています。

モデル特徴

効率的な量子化
出力と埋め込みテンソルはf16形式、その他のテンソルはq5_kまたはq6_k量子化されており、モデルの体積を大幅に削減します。
性能維持
量子化後のモデル性能は純粋なf16バージョンと同等で、明らかな性能低下はありません。
体積最適化
f16.q6とf16.q5の体積は標準的なq8_0量子化よりも小さく、リソースが限られた環境により適しています。

モデル能力

テキスト生成

使用事例

テキスト生成
コンテンツ作成
記事、ストーリー、その他のテキストコンテンツの生成に使用します。
対話システム
チャットボットや対話アシスタントの構築に使用します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase