E

Eagle2 9B

由nvidia開發
Eagle2-9B是NVIDIA發佈的最新視覺語言模型(VLM),在性能和推理速度之間實現了完美平衡。它基於Qwen2.5-7B-Instruct語言模型和Siglip+ConvNext視覺模型構建,支持多語言和多模態任務。
下載量 944
發布時間 : 1/10/2025

模型概述

Eagle2-9B是一個高性能的開源視覺語言模型,專注於從數據中心視角優化VLM後訓練。它通過結合穩健的訓練方案和模型設計,在多項基準測試中表現出色。

模型特點

高性能平衡
在8.9B參數規模下實現了性能與推理速度的完美平衡
多模態支持
支持文本、圖像和視頻輸入,處理多種模態信息
長上下文處理
支持長達16K的上下文長度
基準測試領先
在多個視覺語言基準測試中表現優於同類模型

模型能力

圖像理解
文本生成
多模態對話
文檔問答
圖表理解
視頻分析

使用案例

文檔處理
DocVQA文檔問答
從文檔圖像中提取信息並回答問題
在DocVQA測試集上達到92.6分
視覺問答
TextVQA文本視覺問答
回答關於圖像中文本內容的問題
在TextVQA驗證集上達到83.0分
圖表理解
ChartQA圖表問答
理解和回答基於圖表數據的問題
在ChartQA測試集上達到86.4分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase