E

Eagle2 9B

KnutJaegersbergによって開発
Eagle2は高性能な視覚言語モデルシリーズで、データ戦略とトレーニング手法の最適化を通じてモデル性能を向上させることに焦点を当てています。Eagle2-9Bはこのシリーズの大型モデルで、性能と推論速度の間で良好なバランスを実現しています。
ダウンロード数 15
リリース時間 : 1/23/2025

モデル概要

Eagle2-9Bは視覚言語モデル(VLM)で、画像とテキスト入力を処理し、テキスト出力を生成できます。Qwen2.5-7B-Instruct言語モデルとSiglip+ConvNext視覚モデルを基に構築されており、多言語およびマルチモーダルタスクをサポートします。

モデル特徴

マルチモーダル能力
画像とテキスト入力を同時に処理し、視覚コンテンツを理解して関連するテキストを生成できる
多言語サポート
中国語、英語を含む13言語をサポート
高性能
複数のベンチマークで優れた性能を発揮し、特に文書理解、図表QA、情報抽出タスクで顕著
長文脈サポート
最大16Kの文脈長をサポートし、複雑なタスク処理に適している

モデル能力

画像理解
テキスト生成
マルチモーダル推論
文書分析
図表理解
動画理解
多言語処理

使用事例

文書処理
文書QA
文書画像から情報を抽出し質問に答える
DocVQAテストセットで92.6点を達成
視覚QA
図表理解
図表の内容を理解し説明する
ChartQAテストセットで86.4点を達成
画像QA
画像内容に関する質問に答える
TextVQA検証セットで83.0点を達成
マルチモーダル推論
数学的視覚推論
視覚と数学的推論を必要とする問題を解決
MathVistaテストセットで63.8点を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase