G

Gemma 3 4b It Qat Int4 Unquantized

googleによって開発
Gemma 3はGoogleが提供する軽量マルチモーダルオープンモデルで、テキストと画像の入力をサポートし、テキスト出力を生成します。4Bバージョンはインストラクションチューニングと量子化対応トレーニングを経ており、リソースが限られた環境でのデプロイに適しています。
ダウンロード数 541
リリース時間 : 4/9/2025

モデル概要

Gemini技術に基づく軽量マルチモーダルモデルで、128Kのコンテキストウィンドウと140以上の言語をサポートし、QA、要約、推論など様々なタスクに適用可能です。

モデル特徴

マルチモーダル処理能力
テキストと画像の入力を同時に処理し、クロスモーダルな理解と生成を実現
量子化対応トレーニング
QAT技術を採用し、品質を維持しながらメモリ要件を大幅に削減
大規模コンテキストウィンドウ
128Kトークンのコンテキスト長をサポートし、長文書や複雑なタスクの処理に適している
多言語サポート
140以上の言語をカバーするトレーニングデータで、クロスランゲージ処理能力を備える

モデル能力

テキスト生成
画像内容分析
多言語処理
論理的推論
コード理解と生成
数学問題解決
文書要約

使用事例

コンテンツ生成
インテリジェントQAシステム
テキストまたは画像入力に基づいて正確な回答を生成
BoolQベンチマークで82.4%の精度を達成
文書要約
長文書の簡潔な要約を自動生成
教育支援
数学問題解決
様々な数学問題を解答し推論プロセスを提示
GSM8Kベンチマークで82.6%の精度を達成
プログラミング教育
コードロジックの説明とサンプルコード生成
HumanEvalベンチマークで48.8%の精度を達成
視覚理解
画像キャプション生成
入力画像に対する詳細なテキスト説明を生成
COCOcapベンチマークで116スコア
文書情報抽出
スキャン文書からキー情報を抽出
DocVQAベンチマークで85.6%の精度を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase