G

Gemma 3 12b Pt

googleによって開発
GemmaはGoogleが提供する軽量オープンソースのマルチモーダルモデルシリーズで、Geminiと同じ技術を基に構築されており、テキストと画像の入力をサポートし、テキスト出力を生成します。
ダウンロード数 54.36k
リリース時間 : 3/1/2025

モデル概要

Gemma 3はマルチモーダルモデルで、テキストと画像の入力を処理し、テキスト出力を生成することができ、質問応答、要約、推論など様々なタスクに適しています。128Kの大規模コンテキストウィンドウを備え、140以上の言語をサポートしています。

モデル特徴

マルチモーダル処理能力
テキストと画像の入力を同時に処理し、クロスモーダルな理解と生成を実現
大規模コンテキストウィンドウ
128Kトークンのコンテキスト長をサポートし、長文書や複雑なタスクの処理に適している
多言語サポート
140以上の言語の処理をサポートし、国際化に対応
軽量設計
比較的小さなサイズにより、リソースが限られた環境でもデプロイ可能

モデル能力

テキスト生成
画像理解
質問応答システム
文書要約
論理的推論
コード生成
数学計算
多言語処理

使用事例

コンテンツ生成
画像キャプション生成
入力画像に基づいて詳細な説明を生成
例ではピンクの花に止まるミツバチのシーンを正確に描写
文書要約
長文書を自動要約
質問応答システム
画像ベースの質問応答
画像内容に関する質問に回答
事実ベースの質問応答
知識に基づく質問に回答
TriviaQAベンチマークで78.2点(12Bモデル)を達成
教育
数学問題解答
数学問題の解決と証明
GSM8Kベンチマークで71.0点(12Bモデル)を達成
プログラミング支援
コード生成と説明
HumanEvalベンチマークで45.7点(12Bモデル)を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase