G

Gemma 3n E4B

googleによって開発
Gemma 3nはGoogleが開発した軽量級のマルチモーダルモデルで、Transformerアーキテクチャに基づいており、テキスト、オーディオ、ビジュアル(画像とビデオ)の入力をサポートし、低リソースデバイスに適しています。
ダウンロード数 131
リリース時間 : 6/3/2025

モデル概要

Gemma 3nは高効率なマルチモーダルモデルで、テキスト、オーディオ、ビジュアルの入力をサポートし、コンテンツ作成、研究教育などの多くの分野に適用できます。

モデル特徴

マルチモーダルサポート
テキスト、オーディオ、画像、ビデオの入力をサポートし、様々なタイプのタスクを処理できます。
高効率な実行
選択的パラメータ活性化技術を採用しており、メモリ使用量は従来の4Bモデルと同等で、低リソースデバイスに適しています。
アーキテクチャの革新
MatFormerアーキテクチャを使用しており、ネストされたサブモデルを許可し、カスタムサイズのモデルをサポートします。
多言語サポート
学習データには140種類以上の言語が含まれており、良好なクロス言語処理能力を備えています。

モデル能力

テキスト生成
画像分析
オーディオ文字起こし
ビデオコンテンツ理解
多言語処理

使用事例

コンテンツ作成と通信
クリエイティブテキスト生成
詩、脚本、コード、マーケティングコピー、電子メール草稿を生成します。
画像コンテンツ分析
ビジュアルデータを抽出、解釈、要約してテキスト通信に利用します。
研究と教育
自然言語処理研究
研究者が生成モデルとNLP技術を試すための基礎として利用されます。
言語学習ツール
対話型の言語学習体験をサポートし、文法修正や作文練習に役立ちます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase