E

Eagle X5 34B Chat

由NVEagle開發
Eagle是一系列以視覺為中心的高分辨率多模態大語言模型,通過混合不同架構和知識領域的視覺編碼器增強多模態LLM的感知能力。
下載量 195
發布時間 : 9/14/2024

模型概述

Eagle模型通過混合ViT/卷積網絡等不同架構的視覺編碼器,支持超過1K輸入分辨率,在多模態LLM基準測試中表現優異,尤其在光學字符識別和文檔理解等分辨率敏感任務上。

模型特點

高分辨率支持
支持超過1K輸入分辨率,在光學字符識別和文檔理解等分辨率敏感任務上表現優異。
混合視覺編碼器
通過混合ViT/卷積網絡等不同架構和知識領域的視覺編碼器,增強多模態LLM的感知能力。
多模態能力
結合視覺和文本信息,實現圖像理解和文本生成的多模態任務。

模型能力

圖像理解
文本生成
光學字符識別
文檔理解

使用案例

文檔處理
文檔理解
解析和理解高分辨率文檔中的文本和結構信息。
在多模態LLM基準測試中表現優異。
圖像分析
圖像描述生成
根據輸入的圖像生成詳細的文本描述。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase