G

Gemma 3n E4B It 4bit MLX

NexaAIによって開発
Gemma 3nはGoogle Gemmaモデルをベースにしたマルチモーダル軽量オープンソースモデルで、テキスト、画像、ビデオ、音声入力に対応し、低リソースデバイス向けに最適化されています。
ダウンロード数 122
リリース時間 : 7/13/2025

モデル概要

Gemma 3nはGoogleが提供する軽量オープンソースモデルで、Geminiと同じ技術を採用し、マルチモーダル入力とテキスト出力に対応し、低リソースデバイスに適しています。

モデル特徴

マルチモーダル対応
テキスト、画像、音声、ビデオ入力を処理し、テキスト出力を生成できます。
低リソース最適化
選択的パラメータ活性化技術を採用し、リソース要件を削減し、低リソースデバイスでの実行に適しています。
効率的なパラメータ管理
20億と40億のパラメータの有効規模で動作し、総パラメータ数より少なくなっています。
多言語対応
140種以上の口語言語のデータを使用して学習され、強力な多言語処理能力を備えています。

モデル能力

テキスト生成
画像内容分析
音声データ処理
ビデオ内容理解
多言語テキスト処理

使用事例

コンテンツ生成
文書要約
長い文書を入力し、簡潔な要約を生成します。
正確で首尾一貫した要約を効率的に生成します。
質問回答
質問を入力し、詳細な回答を生成します。
複数のベンチマークテストで優れた性能を発揮します。
マルチモーダル分析
画像説明生成
画像を入力し、詳細な文字説明を生成します。
複数の解像度に対応し、高品質な説明を生成します。
音声文字起こし
音声データを入力し、文字起こしを生成します。
1秒あたり6.25個のトークンにエンコードされ、モノラル対応です。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase