G

Gemma 3 12b It Gguf

Mungertによって開発
Gemma-3はGoogleが提供する軽量マルチモーダルオープンモデルで、テキストと画像の入力に対応し、テキスト出力を生成します。Geminiモデルの研究と技術に基づいて構築されており、128Kの大規模コンテキストウィンドウを備え、140以上の言語をサポートしています。
ダウンロード数 4,574
リリース時間 : 3/12/2025

モデル概要

Gemma-3はマルチモーダルモデルで、テキスト生成や画像理解タスク、質問応答、要約、推論などに適しています。比較的小さいサイズのため、リソースが限られた環境でのデプロイが可能です。

モデル特徴

マルチモーダルサポート
テキストと画像の入力に対応し、テキスト出力を生成するため、多様なタスクに適用可能です。
大規模コンテキストウィンドウ
128Kの大規模コンテキストウィンドウを備えており、長文や複雑なタスクの処理に適しています。
軽量設計
比較的小さいサイズのため、ノートパソコンや自社クラウドインフラなど、リソースが限られた環境でのデプロイが可能です。
多言語サポート
140以上の言語をサポートしており、グローバルなアプリケーションに適しています。

モデル能力

テキスト生成
画像理解
質問応答
要約
推論

使用事例

コンテンツ生成
画像キャプション生成
入力された画像に基づいて詳細な説明テキストを生成します。
正確で詳細な画像説明を生成し、アクセシビリティサービスやコンテンツラベリングに適しています。
質問応答システム
テキストまたは画像入力に基づく質問応答システムです。
正確な回答を提供し、カスタマーサポートや教育シーンに適しています。
データ分析
ドキュメント要約
長文ドキュメントを要約し、キー情報を抽出します。
簡潔で情報量の多い要約を生成し、読解効率を向上させます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase