gemma-3-4b-it-abliterated-GGUFオープンソースモデル - 混合精度量子化、小さなサイズで高いパフォーマンスを維持

ホーム

Gemma 3 4b It Abliterated GGUF

ZeroWwによって開発

革新的な量子化手法により、より小さなモデルサイズと高性能を両立

大規模言語モデル英語オープンソースライセンス:MIT #混合精度量子化 #効率的なテキスト生成 #f16埋め込み最適化

ダウンロード数 247

リリース時間 : 3/22/2025

モデル概要

このモデルは独自開発の混合精度量子化手法を採用し、出力層と埋め込み層にはf16精度を、その他の部分にはq5_kまたはq6_k精度を使用することで、標準q8_0よりも小さなサイズを実現しつつ、純粋なf16量子化と同等の性能を維持しています。

モデル特徴

混合精度量子化

出力層と埋め込み層にf16精度を、その他の部分にq5_kまたはq6_k精度を使用し、効率的な量子化を実現

サイズ最適化

f16.q6とf16.q5の2つの量子化手法はいずれも標準q8_0量子化よりも小さなサイズを実現

性能維持

量子化後も純粋なf16量子化と同等の性能を維持

モデル能力

テキスト生成

使用事例

自然言語処理

効率的なテキスト生成

生成品質を維持しながらモデルサイズを削減

標準q8_0よりも小さなサイズを実現し、純粋なf16量子化と同等の性能を維持

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Gemma 3 4b It Abliterated GGUF

モデル概要

モデル特徴

モデル能力

使用事例

🚀 独自の量子化モデル (ZeroWw)

✨ 主な機能

📊 結果

📅 更新日

📄 ライセンス