E

Eagle X4 8B Plus

NVEagleによって開発
Eagleは、ビジュアルを中心とした高解像度マルチモーダル大規模言語モデルファミリーで、複数のビジュアルエンコーダと異なる入力解像度を融合することで、マルチモーダル大規模言語モデルの感知能力を強化しています。
ダウンロード数 1,699
リリース時間 : 9/7/2024

モデル概要

Eagleは、ビジュアルに特化した高解像度マルチモーダル大規模言語モデルで、1Kを超える入力解像度をサポートし、光学文字認識や文書理解などの解像度に敏感なタスクで優れた性能を発揮します。

モデル特徴

マルチモーダル融合
チャネル結合に基づく「CLIP+X」融合方式を採用し、異なるアーキテクチャと知識を持つビジュアルエキスパートを結合します。
高解像度サポート
1Kを超える入力解像度をサポートし、解像度に敏感なタスクで突出した性能を発揮します。

モデル能力

画像理解
テキスト生成
光学文字認識
文書理解

使用事例

文書処理
文書内容理解
高解像度文書の内容と構造を解析して理解します。
マルチモーダル大規模言語モデルのベンチマークテストで優れた成績を収めました。
画像分析
高解像度画像記述
高解像度画像の詳細な記述を生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase