E

Eagle2 1B

nvidiaによって開発
イーグル2は高性能な視覚言語モデルファミリーで、データ戦略とトレーニング手法の透明性に重点を置き、競争力のある視覚言語モデルのオープンソースコミュニティ開発を推進することを目的としています。
ダウンロード数 1,791
リリース時間 : 1/10/2025

モデル概要

イーグル2-1Bは、高速な推論と最小限の計算リソースを必要とするシナリオ向けに設計されたコンパクトで効率的な視覚言語モデルで、コア性能を維持しています。

モデル特徴

高効率性能
コンパクトな1Bパラメータ規模でありながら、より大規模なモデルと競合する性能を維持。
多言語サポート
多言語の視覚言語理解タスクをサポート。
長文脈処理
最大16Kの文脈長をサポートし、複雑なタスクの処理に適しています。
透明なデータ戦略
再現性と革新を容易にするため、データ戦略の透明性を重視。

モデル能力

視覚言語理解
画像テキスト生成
マルチモーダル推論
文書理解
チャート分析

使用事例

文書処理
DocVQA
文書視覚質問応答
テストセット精度81.8
チャート分析
ChartQA
チャート質問応答
テストセット精度77.0
視覚質問応答
TextVQA
テキスト視覚質問応答
検証セット精度76.6
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase