G

Gemma 3 12b It Int4 Gguf

gaunernstによって開発
Gemma 3はGoogleが提供する軽量マルチモーダルオープンモデルで、テキストと画像の入力に対応しテキストを出力します。128Kの大規模コンテキストウィンドウと140以上の言語をサポートしています。
ダウンロード数 107
リリース時間 : 3/31/2025

モデル概要

Gemma 3はGemini技術を基に構築された軽量マルチモーダルモデルで、テキストと画像の入力を処理しテキストを出力できます。事前学習と命令チューニングの2つのバリエーションがあり、質問応答、要約、推論など様々なタスクに適しています。

モデル特徴

マルチモーダル能力
テキストと画像の入力を同時に処理し、クロスモーダルな理解と生成を実現
大規模コンテキストウィンドウ
128Kトークンのコンテキストウィンドウで、長文書や複雑なタスクの処理をサポート
多言語サポート
140以上の言語を含む学習データで、多言語処理能力を備えています
効率的な推論
INT4量子化バージョンにより計算リソース要件を大幅に削減、ローカル展開に適しています

モデル能力

テキスト生成
画像理解
多言語処理
質問応答システム
文書要約
論理的推論
コード生成

使用事例

コンテンツ理解と生成
画像キャプション生成
入力画像に基づいて詳細な文章説明を生成
画像内の物体、シーン、関係を正確に認識可能
文書要約
長文書から主要情報を抽出して要約
核心情報を保持した簡潔で正確な要約を生成
インテリジェントアシスタント
マルチモーダル質問応答
画像とテキスト情報を組み合わせて複雑な質問に回答
画像内容を理解しそれに基づいて回答可能
プログラミング支援
自然言語記述に基づいてコードを生成または説明
複数のプログラミング言語のコード生成と理解をサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase