E

Eagle X4 8B Plus

由NVEagle開發
Eagle是一個以視覺為中心的高分辨率多模態大語言模型家族,通過融合多種視覺編碼器和不同輸入分辨率,增強了多模態大語言模型的感知能力。
下載量 1,699
發布時間 : 9/7/2024

模型概述

Eagle是一個專注於視覺的高分辨率多模態大語言模型,支持超過1K的輸入分辨率,在光學字符識別和文檔理解等對分辨率敏感的任務上表現優異。

模型特點

多模態融合
採用基於通道拼接的'CLIP+X'融合方式,結合不同架構和知識的視覺專家。
高分辨率支持
支持超過1K的輸入分辨率,在對分辨率敏感的任務上表現突出。

模型能力

圖像理解
文本生成
光學字符識別
文檔理解

使用案例

文檔處理
文檔內容理解
解析和理解高分辨率文檔中的內容和結構
在多模態大語言模型基準測試中取得優異成績
圖像分析
高分辨率圖像描述
生成高分辨率圖像的詳細描述
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase