G

Gemma 3 4b It

Developed by google
GemmaはGoogleが提供する軽量で先進的なオープンモデルシリーズで、Geminiと同じ研究と技術に基づいて構築されています。Gemma 3はマルチモーダルモデルで、テキストと画像の入力を処理し、テキスト出力を生成できます。
Downloads 608.22k
Release Time : 2/20/2025

Model Overview

Gemma 3はマルチモーダルモデルで、テキストと画像の入力をサポートし、テキスト出力を生成します。質問応答、要約、推論など様々なタスクに適しており、128Kの大規模コンテキストウィンドウを備え、140以上の言語をサポートしています。

Model Features

マルチモーダル能力
テキストと画像の入力を同時に処理し、テキスト出力を生成できます。
大規模コンテキストウィンドウ
128Kトークンの入力コンテキストウィンドウをサポートし、長文書や複雑なタスクの処理に適しています。
多言語サポート
140以上の言語をサポートし、強力な多言語処理能力を備えています。
軽量設計
比較的小さなサイズにより、ノートパソコンやクラウドインフラなどリソースが限られた環境でのデプロイが可能です。

Model Capabilities

テキスト生成
画像理解
多言語処理
質問応答
要約
推論

Use Cases

コンテンツ生成
画像キャプション生成
入力された画像に基づいて詳細な文章説明を生成します。
画像内の物体、シーン、詳細を正確に記述できます。
文書要約
長文書を要約し、キー情報を抽出します。
簡潔で情報量の豊富な要約を生成します。
質問応答システム
視覚的質問応答
画像内容に関する質問に回答します。
画像内の物体を正確に識別し、関連する質問に回答できます。
知識質問応答
テキスト知識に基づく質問に回答します。
正確で情報量の豊富な回答を提供します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase