G

Gemma 3 4b It

googleによって開発
GemmaはGoogleが提供する軽量で先進的なオープンモデルシリーズで、Geminiと同じ研究と技術に基づいて構築されています。Gemma 3はマルチモーダルモデルで、テキストと画像の入力を処理し、テキスト出力を生成できます。
ダウンロード数 608.22k
リリース時間 : 2/20/2025

モデル概要

Gemma 3はマルチモーダルモデルで、テキストと画像の入力をサポートし、テキスト出力を生成します。質問応答、要約、推論など様々なタスクに適しており、128Kの大規模コンテキストウィンドウを備え、140以上の言語をサポートしています。

モデル特徴

マルチモーダル能力
テキストと画像の入力を同時に処理し、テキスト出力を生成できます。
大規模コンテキストウィンドウ
128Kトークンの入力コンテキストウィンドウをサポートし、長文書や複雑なタスクの処理に適しています。
多言語サポート
140以上の言語をサポートし、強力な多言語処理能力を備えています。
軽量設計
比較的小さなサイズにより、ノートパソコンやクラウドインフラなどリソースが限られた環境でのデプロイが可能です。

モデル能力

テキスト生成
画像理解
多言語処理
質問応答
要約
推論

使用事例

コンテンツ生成
画像キャプション生成
入力された画像に基づいて詳細な文章説明を生成します。
画像内の物体、シーン、詳細を正確に記述できます。
文書要約
長文書を要約し、キー情報を抽出します。
簡潔で情報量の豊富な要約を生成します。
質問応答システム
視覚的質問応答
画像内容に関する質問に回答します。
画像内の物体を正確に識別し、関連する質問に回答できます。
知識質問応答
テキスト知識に基づく質問に回答します。
正確で情報量の豊富な回答を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase