E

Eagle2 2B

nvidiaによって開発
Eagle2はNVIDIAが開発した高性能視覚言語モデルファミリーで、データ戦略とトレーニング手法を通じてオープンソースの視覚言語モデルの性能を向上させることに焦点を当てています。Eagle2-2Bはこのシリーズの軽量モデルで、強力な性能を維持しながら優れた効率性と速度を実現しています。
ダウンロード数 667
リリース時間 : 1/10/2025

モデル概要

Eagle2-2Bは視覚と言語能力を統合したマルチモーダルモデルで、画像、テキスト、動画入力を処理し、さまざまな視覚言語タスクを実行できます。

モデル特徴

高効率軽量
20億パラメータ規模で優れた性能と速度のバランスを実現
マルチモーダル処理
画像、テキスト、動画入力の統合処理能力をサポート
長文脈サポート
最大16Kトークンの文脈長をサポート
高性能ベンチマーク
複数の視覚言語ベンチマークテストで優れた成績

モデル能力

画像理解と説明
視覚的質問応答
文書理解
グラフ分析
動画内容理解
マルチモーダル推論

使用事例

文書処理
文書QA
スキャン文書やPDFから情報を抽出し質問に回答
DocVQAテストセットで88.0点を達成
視覚的質問応答
画像内容QA
画像内容に関する複雑な質問に回答
TextVQA検証セットで79.1点を達成
教育支援
グラフ理解
様々なグラフデータの解釈と分析
ChartQAテストセットで82.0点を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase