G

Gemma 3n E2B It Unsloth Bnb 4bit

unslothによって開発
Gemma 3n-E2B-itはGoogleが提供する軽量オープンソースのマルチモーダルモデルで、Geminiと同じ技術に基づいて構築され、低リソースデバイス向けに最適化されています。
ダウンロード数 4,914
リリース時間 : 6/26/2025

モデル概要

テキスト、画像、ビデオ、音声の入力をサポートするマルチモーダルモデルで、高品質なテキスト出力を生成でき、多言語やさまざまなタスクに適しています。

モデル特徴

マルチモーダルサポート
テキスト、画像、ビデオ、音声の入力を同時に処理し、クロスモーダル理解を実現します。
低リソース最適化
選択的パラメータ活性化技術を採用し、2B/4Bパラメータ規模で効率的に動作します。
多言語能力
140種類以上の言語のデータで訓練され、クロス言語処理能力を備えています。
オープンウェイト
事前学習と命令調整版のオープンウェイトを提供します。

モデル能力

テキスト生成
画像内容分析
音声文字起こし
多言語翻訳
コード生成
数学的推論
ビジュアル質問応答

使用事例

コンテンツ生成
画像説明生成
入力された画像に基づいて詳細な説明を生成します。
サンプル出力では、画像内のハチと花の詳細を正確に識別します。
スマートアシスタント
マルチモーダル対話
画像とテキストの入力を組み合わせて自然な対話を行います。
画像内容に関する複雑な質問に正しく答えることができます。
教育
STEM問題解決
数学と科学の問題を解きます。
ARC - cベンチマークテストで61.6の正解率を達成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase