Gemma - 3小型思考モデルのオープンソース化 - 消費者向けGPUに適合し、マルチタスク汎用推論の無料デプロイ

Gemma 3 12B FornaxV.2 QAT CoT Q4 0 GGUF

ConicCatによって開発

これは8GiBのコンシューマー向けGPUで動作することを目的とした実験的な小型思考モデルで、汎用推論能力を備えています。教師あり微調整（SFT）と高品質な推論軌跡トレーニングにより、モデルは推論能力を様々なタスクに汎化できます。

大規模言語モデル #コンシューマー向けGPU推論 #汎用思考連鎖 #低メモリ最適化

ダウンロード数 98

リリース時間 : 5/6/2025

モデル概要

Gemma FornaxはGemma 3ベースの12Bパラメーターモデルで、汎用推論能力に焦点を当てており、コーディング、数学、その他のタスクに適しています。QATチェックポイントトレーニングにより、Q4_0量子化下で使用しても品質低下が発生しません。

モデル特徴

汎用推論能力

多様で高品質な推論軌跡の教師あり微調整（SFT）により、モデルはプログラミングや数学に限定されず、多くのタスクに推論能力を汎化できます。

低リソース要件

モデルは8GiBのコンシューマー向けGPUで動作するように設計されており、Q4_0量子化下では約6GiBのメモリのみを必要とします。

思考モード切替

Qwen 3シリーズモデルと同様に、Gemma Fornaxは思考モードを有効または無効にでき、システムプロンプト内の`/think`または`/no_think`コマンドで制御します。

QAT最適化

QATチェックポイントに基づくトレーニングにより、モデルはQ4_0量子化下で使用しても品質低下が発生しません。

モデル能力

テキスト生成

汎用推論

数学問題解決

プログラミング支援

使用事例

教育と学習

数学問題解答

モデルは複雑な数学問題を解決し、詳細な推論プロセスを提供できます。

思考モードを通じて詳細な解答ステップを生成します。

プログラミング開発

コード生成と最適化

モデルはコードスニペットの生成や既存コードの最適化に使用できます。

効率的で実行可能なコードを生成します。

クリエイティブライティング

ストーリー生成

モデルはクリエイティブなストーリーやキャラクター設定を生成できます。

一貫性があり創造性豊かなテキストコンテンツを生成します。

🚀 Gemma 3 12B V2 Fornax Q4_0 GGUF

このモデルは、8GBの消費者向けグラフィックカードに収まり、汎用的な推論能力を持つ強力な小型思考モデルを作成する試みです。他の多くのオープンソースの思考モデル、特に小型のものは、コーディングや数学以外のタスクに推論能力を一般化できません。これは、GRPO zero for CoTに過度に焦点を当てているためで、これはコーディングと数学にのみ適用可能です。

このモデルは、GRPOを使用する代わりに、Deepseek R1からの多様な高品質の推論トレースをGemma 3にSFTすることを目指しています。これにより、LiMO論文の数学/コーディングCoTへのアプローチを拡張して、モデルに多数のタスクに対して推論能力を効果的に一般化させます。また、V3 O3/24の非思考データのサブセットも含まれており、創造性を向上させ、モデルが非思考能力を維持できるようにしています。

QATチェックポイントからのトレーニングにより、このモデルはQ4_0で品質を低下させることなく使用でき、約6GBのメモリしか必要としません。

✨ 主な機能

思考モード

Qwen 3モデルラインと同様に、Gemma Fornaxは思考モードを有効または無効にして使用できます。

思考モードを有効にするには、システムプロンプトに/thinkを入れ、思考モード用に<think>\nを事前入力します。
思考モードを無効にするには、システムプロンプトに/no_thinkを入れます。

設定

Sillytavern用のサンプラーとテンプレートのJSON設定ファイルを使用することをお勧めします。デフォルト設定は、書式設定の問題によりGemma 3とうまく動作しません。

📦 インストール

原文書にインストール手順は記載されていないため、このセクションは省略されます。

💻 使用例

原文書にコード例は記載されていないため、このセクションは省略されます。

📚 ドキュメント

モデル情報

プロパティ	詳細
ベースモデル	ConicCat/Gemma-3-12B-FornaxV.2-QAT-CoT
ライセンス	gemma
タグ	gemma3, gemma, google
パイプラインタグ	image-text-to-text
ライブラリ名	transformers
データセット	GeneralReasoning/GeneralThought-430K, Undi95/R1-RP-ShareGPT3, PJMixers-Dev/Gryphe-Aesir-RPG-Charcards-Opus-Mixed-split-v3-0324