G

Gemma 3 4b It Qat Q4 0 Unquantized

googleによって開発
Gemma 3はGoogleが提供する軽量オープンソースのマルチモーダルモデルで、Geminiと同じ技術を基に構築されており、テキストと画像の入力を受け取りテキスト出力を生成します。
ダウンロード数 1,159
リリース時間 : 4/8/2025

モデル概要

Gemma 3はマルチモーダルモデルで、テキストと画像の入力を処理しテキスト出力を生成できます。128Kの大規模コンテキストウィンドウを備え、140以上の言語をサポートし、質問応答、要約、推論など様々なタスクに適しています。

モデル特徴

マルチモーダル能力
テキストと画像の入力をサポートし、画像内容を理解・分析して関連するテキスト出力を生成できます。
大規模コンテキストウィンドウ
128Kの大規模コンテキストウィンドウを備え、より長い入力シーケンスを処理できます。
多言語サポート
140以上の言語をサポートし、グローバルな多言語タスクに適しています。
軽量設計
比較的小さなサイズにより、ノートパソコン、デスクトップ、クラウドインフラなどリソースが限られた環境でも展開可能です。
量子化認識トレーニング
量子化認識トレーニング(QAT)を使用し、メモリ要件を低減しながらbfloat16と同等の性能を維持できます。

モデル能力

テキスト生成
画像分析
質問応答
要約
推論
コード生成
数学問題解決
多言語処理

使用事例

質問応答システム
オープンドメインQA
ユーザーの様々な質問に答え、正確な情報を提供します。
BoolQベンチマークでは、4Bモデルは72.3の精度を達成しました。
ドキュメント処理
ドキュメント要約
長文ドキュメントの簡潔な要約を自動生成します。
画像理解
画像キャプション生成
画像内容を分析し、記述的なテキストを生成します。
COCOcapベンチマークでは、4Bモデルは102のスコアを獲得しました。
教育
数学問題解答
様々な数学問題を解決し、詳細な手順を提供します。
GSM8Kベンチマークでは、4Bモデルは38.4の精度を達成しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase