G

Gemma 3 4b It Qat Q4 0 Gguf

googleによって開発
Gemma 3はGoogleが提供する軽量で最先端のオープンソースマルチモーダルモデルで、テキストと画像の入力に対応しテキストを出力します。128Kのコンテキストウィンドウと140以上の言語をサポート
ダウンロード数 19.81k
リリース時間 : 3/12/2025

モデル概要

Gemini技術を基に構築された軽量オープンソースモデルシリーズで、質問応答、要約、推論など様々なテキスト生成と画像理解タスクに適しています

モデル特徴

マルチモーダル能力
画像とテキストのデュアルモーダル入力をサポートし、クロスモーダル理解と分析が可能
超大規模コンテキストウィンドウ
128Kトークンのコンテキスト処理能力で、同規模モデルを凌駕
量子化認識トレーニング
QAT技術で最適化されたGGUFフォーマットにより、メモリ使用量を削減しながら高品質な出力を維持
責任あるAI設計
多段階のコンテンツフィルタリングと安全性評価を経ており、GoogleのAI原則に準拠

モデル能力

テキスト生成
画像コンテンツ分析
多言語処理
コード生成
数学的推論
ドキュメント要約

使用事例

コンテンツ作成
クリエイティブライティング支援
詩や物語などの創造的なテキストを生成
文学的なスタイルに合致した一貫性のあるテキストを生成可能
技術文書生成
要件に基づいてコードドキュメントを自動生成
複数のプログラミング言語のドキュメント生成をサポート
視覚分析
画像キャプション生成
入力画像に対して自然言語の説明を生成
COCOcapベンチマークで102-116のスコアを達成
ドキュメント視覚的質問応答
スキャン文書の情報を解析し質問に回答
DocVQA valセットで72.8-85.6%の精度
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase