E

Eagle X5 13B Chat

由NVEagle開發
鷹(Eagle)是一系列以視覺為中心的高分辨率多模態大語言模型,支持超過1K的輸入分辨率,在光學字符識別和文檔理解等任務上表現出色。
下載量 1,748
發布時間 : 8/23/2024

模型概述

該模型通過融合多種視覺編碼器和不同輸入分辨率來增強多模態大語言模型的感知能力,採用基於通道拼接的'CLIP+X'融合方式,融合不同架構和知識的視覺專家。

模型特點

多模態融合
採用基於通道拼接的'CLIP+X'融合方式,融合不同架構(ViT/卷積網絡)和知識(檢測/分割/OCR/自監督學習)的視覺專家。
高分辨率支持
支持超過1K的輸入分辨率,在對分辨率敏感的任務上表現出色。

模型能力

圖像理解
文本生成
光學字符識別
文檔理解

使用案例

文檔處理
文檔內容理解
解析和理解高分辨率文檔中的內容和結構
在高分辨率文檔理解任務中表現優異
圖像分析
複雜場景理解
分析包含豐富細節的高分辨率圖像
在細節豐富的場景中保持高精度
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase