G

Gemma 3 12b It Qat Int4 Unquantized

googleによって開発
Gemma 3はGoogleが提供する軽量マルチモーダルオープンモデルで、テキストと画像の入力をサポートし、テキスト出力を生成可能。128Kの大規模コンテキストウィンドウと多言語能力を備えています。
ダウンロード数 1,358
リリース時間 : 4/9/2025

モデル概要

Gemma 3はGemini技術を基に構築された軽量オープンモデルシリーズで、12Bバージョンはインストラクションチューニングと量子化認識トレーニング(QAT)を経ており、テキスト生成や画像理解などのタスクに適しています。リソースが限られた環境での展開が可能です。

モデル特徴

マルチモーダル能力
テキストと画像の入力をサポートし、複雑なマルチモーダルタスクを処理可能
大規模コンテキストウィンドウ
128Kトークンのコンテキスト長で、長文書や複雑なタスクの処理に適している
量子化認識トレーニング
QAT技術を採用し、品質を維持しながらメモリ要件を大幅に低減
多言語サポート
140以上の言語をサポートし、グローバルな適用性を備えている

モデル能力

テキスト生成
画像内容分析
多言語処理
質問応答システム
文書要約
論理的推論
コード生成
数学問題解決

使用事例

コンテンツ生成
自動要約
長文書に対して簡潔で正確な要約を生成
Natural Questionsベンチマークで36.1点(5-shot)を達成
クリエイティブライティング
プロンプトに基づいてストーリーや詩などのクリエイティブコンテンツを生成
視覚理解
画像説明
画像に対して詳細な文章説明を生成
COCOcapベンチマークで116点を達成
文書分析
スキャン文書から情報を抽出・理解
DocVQAベンチマークで85.6点を達成
教育
数学指導
数学問題を解答し、解法ステップを説明
GSM8Kベンチマークで82.6点(8-shot)を達成
言語学習
多言語翻訳と学習支援を提供
WMT24++ベンチマークで55.7点(ChrF)を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase