G

Gemma 3 12b It

googleによって開発
GemmaはGoogleが提供する軽量で最先端のオープンソースマルチモーダルモデルシリーズで、Geminiモデルの技術を基に構築されており、テキストと画像の入力をサポートし、テキスト出力を生成します。
ダウンロード数 364.65k
リリース時間 : 3/1/2025

モデル概要

Gemma 3はマルチモーダルモデルで、テキストと画像の入力を処理し、テキスト応答を生成できます。質問応答、要約、推論など様々なタスクに適しており、140以上の言語をサポートし、128Kの大規模コンテキストウィンドウを備えています。

モデル特徴

マルチモーダル能力
テキストと画像の入力を同時に処理し、クロスモーダルな理解と生成を実現
大規模コンテキストウィンドウ
12Bと27Bモデルは128Kトークンのコンテキスト長をサポートし、長文書や複雑なタスクの処理に適しています
多言語サポート
140以上の言語を含むトレーニングデータにより、強力な多言語処理能力を備えています
効率的なデプロイ
比較的小さなサイズにより、ノートパソコンやデスクトップなどリソースが限られた環境でもデプロイ可能

モデル能力

テキスト生成
画像理解
多言語処理
質問応答システム
文書要約
論理的推論
コード生成
数学計算

使用事例

コンテンツ生成
画像キャプション生成
入力画像に基づいて詳細な説明を生成
画像内容を正確に認識し、自然言語の説明を生成可能
文書要約
長文書を自動要約
簡潔で正確な要約を生成し、重要な情報を保持
知識質問応答
画像に基づく質問応答
画像内容に関する質問に回答
画像内容を正しく理解し、関連する質問に回答可能
事実に基づく質問応答
知識に基づく様々な質問に回答
複数のベンチマークテストで優れたパフォーマンスを発揮
教育支援
数学問題解答
数学問題を解決し、解答手順を説明
GSM8Kなどの数学ベンチマークテストで良好な結果
プログラミング支援
コードを生成・説明
複数のプログラミング言語のコードタスクを処理可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase