G

Gemma 3 12b It Qat Int4 GGUF

unslothによって開発
Gemma 3はGoogleがGemini技術を基に構築した軽量オープンモデルシリーズで、12Bバージョンは量子化対応トレーニング(QAT)技術を採用し、マルチモーダル入力と128Kコンテキストウィンドウをサポートします。
ダウンロード数 1,921
リリース時間 : 4/25/2025

モデル概要

Gemma 3はマルチモーダルモデルで、テキストと画像入力を処理しテキスト出力を生成でき、事前学習と命令チューニングの2つのバリエーションを提供します。140以上の言語をサポートし、質問応答、要約、推論などのタスクに適しています。

モデル特徴

量子化対応トレーニング(QAT)
QAT技術を採用し効率的な量子化を実現、メモリ使用量を削減しながらbfloat16と同等のモデル品質を維持
マルチモーダル処理
テキストと画像入力(896x896解像度)をサポート、各画像は256トークンとしてエンコード
超長文コンテキスト
12Bモデルは128Kトークンのコンテキストウィンドウ長をサポート
多言語サポート
140以上の言語を含むトレーニングデータで、強力なクロスランゲージ能力を備える

モデル能力

テキスト生成
画像内容分析
多言語処理
コード生成
数学的推論
視覚的質問応答

使用事例

コンテンツ生成
自動要約
長文書に対して簡潔な要約を生成
TriviaQAベンチマークで78.2点(5サンプル)を達成
クリエイティブライティング
プロンプトに基づいて物語や詩を生成
知識質問応答
オープンドメインQA
様々な事実質問に回答
Natural Questionsベンチマークで31.4点(5サンプル)を達成
視覚理解
画像キャプション生成
画像に対して自然言語の説明を生成
COCOキャプションベンチマークで111点を達成
ドキュメント分析
ドキュメント画像の内容と構造を解析
DocVQA検証セットで82.3点を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase