G

Gemma 3n E2B It

googleによって開発
Gemma 3nはGoogleが開発した軽量で最先端のオープンソースのマルチモーダルモデルファミリーで、Geminiモデルと同じ研究と技術に基づいて構築されています。テキスト、オーディオ、ビジュアル入力をサポートし、様々なタスクに適用できます。
ダウンロード数 1,183
リリース時間 : 6/12/2025

モデル概要

Gemma 3nは効率的なマルチモーダルモデルで、テキスト、画像、ビデオ、オーディオ入力を処理し、テキスト出力を生成することができます。低リソースデバイスでの実行に特化して設計され、革新的なパラメータ管理技術を備えています。

モデル特徴

マルチモーダル入力サポート
テキスト、画像、ビデオ、オーディオ入力を同時に処理し、真のマルチモーダル理解を実現します。
効率的なパラメータ管理
選択的パラメータ活性化技術を採用し、20億の有効パラメータを持つモデルの性能を従来のより大きなモデルに近づけます。
低リソース最適化
低リソースデバイスでの効率的な実行に特化して設計され、メモリ使用量は従来の20億パラメータモデルと同等です。
広範な言語サポート
140種以上の言語のデータで訓練され、多言語処理能力を備えています。

モデル能力

テキスト生成
画像内容分析
ビデオ内容理解
音声文字起こし
多言語処理
コード生成
数学的推論

使用事例

コンテンツ作成と通信
創造的なテキスト生成
詩、脚本、マーケティングコピーなどの創造的なコンテンツを生成します。
要求に合った多様な創造的なテキストを生成できます。
画像内容記述
画像内容を分析し、詳細な記述を生成します。
画像内のオブジェクトとシーンを正確に識別できます。
カスタマーサービス
マルチモーダルカスタマーサービスアシスタント
テキスト、画像などの様々な方法でユーザーと対話します。
正確な質問の解答とガイダンスを提供します。
研究と教育
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase