G

Gemma 3n E4B It Litert Preview GGUF

unslothによって開発
Gemma-3n-E4B-it-litert-previewはGoogleのGemma 3nモデルを微調整したバージョンで、画像とテキスト入力をサポートし、テキスト出力を生成し、マルチモーダルタスクに適しています。
ダウンロード数 134
リリース時間 : 7/8/2025

モデル概要

GemmaはGoogleが提供する軽量で最先端のオープンソースモデルシリーズで、Geminiモデルと同じ研究と技術に基づいて構築されています。Gemma 3nモデルは低リソースデバイスでの効率的な実行を目的として設計されており、テキスト、画像、ビデオ、オーディオを含むマルチモーダル入力をサポートし、テキスト出力を生成します。

モデル特徴

マルチモーダル入力サポート
テキスト、画像、ビデオ、オーディオ入力をサポートし、テキスト出力を生成します。
高効率実行
低リソースデバイスでの高効率実行を目的として設計されており、リソースが制限された環境に適しています。
高性能
様々なベンチマークテストで優れた性能を発揮し、特に推論と事実性タスクで顕著です。
広範な言語サポート
学習データには140種類以上の言語の内容が含まれており、多言語タスクをサポートします。

モデル能力

テキスト生成
画像分析
音声文字起こし
マルチモーダルタスク処理

使用事例

コンテンツ生成
画像説明生成
入力された画像に基づいて詳細な説明テキストを生成します。
正確で詳細な画像説明を生成します。
ドキュメント要約
入力されたドキュメントを要約し、簡潔な要約を生成します。
高品質のドキュメント要約を生成します。
質問応答システム
マルチモーダル質問応答
画像とテキスト入力を組み合わせて質問に回答します。
特に視覚関連の質問に対して正確な回答を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase