G

Gemma 3 12b It Qat Int4 GGUF

Developed by unsloth
Gemma 3はGoogleがGemini技術を基に構築した軽量オープンモデルシリーズで、12Bバージョンは量子化対応トレーニング(QAT)技術を採用し、マルチモーダル入力と128Kコンテキストウィンドウをサポートします。
Downloads 1,921
Release Time : 4/25/2025

Model Overview

Gemma 3はマルチモーダルモデルで、テキストと画像入力を処理しテキスト出力を生成でき、事前学習と命令チューニングの2つのバリエーションを提供します。140以上の言語をサポートし、質問応答、要約、推論などのタスクに適しています。

Model Features

量子化対応トレーニング(QAT)
QAT技術を採用し効率的な量子化を実現、メモリ使用量を削減しながらbfloat16と同等のモデル品質を維持
マルチモーダル処理
テキストと画像入力(896x896解像度)をサポート、各画像は256トークンとしてエンコード
超長文コンテキスト
12Bモデルは128Kトークンのコンテキストウィンドウ長をサポート
多言語サポート
140以上の言語を含むトレーニングデータで、強力なクロスランゲージ能力を備える

Model Capabilities

テキスト生成
画像内容分析
多言語処理
コード生成
数学的推論
視覚的質問応答

Use Cases

コンテンツ生成
自動要約
長文書に対して簡潔な要約を生成
TriviaQAベンチマークで78.2点(5サンプル)を達成
クリエイティブライティング
プロンプトに基づいて物語や詩を生成
知識質問応答
オープンドメインQA
様々な事実質問に回答
Natural Questionsベンチマークで31.4点(5サンプル)を達成
視覚理解
画像キャプション生成
画像に対して自然言語の説明を生成
COCOキャプションベンチマークで111点を達成
ドキュメント分析
ドキュメント画像の内容と構造を解析
DocVQA検証セットで82.3点を達成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase