E

Eagle2 2B

由nvidia開發
Eagle2是NVIDIA推出的高性能視覺語言模型家族,專注於通過數據策略和訓練方案提升開源視覺語言模型的性能。Eagle2-2B是該系列中的輕量級模型,在保持強勁性能的同時實現卓越效率和速度。
下載量 667
發布時間 : 1/10/2025

模型概述

Eagle2-2B是一個融合視覺和語言能力的多模態模型,能夠處理圖像、文本和視頻輸入,執行多種視覺語言任務。

模型特點

高效輕量
在2B參數規模下實現卓越的性能和速度平衡
多模態處理
支持圖像、文本和視頻輸入的綜合處理能力
長上下文支持
支持長達16K tokens的上下文長度
高性能基準
在多個視覺語言基準測試中表現優異

模型能力

圖像理解與描述
視覺問答
文檔理解
圖表分析
視頻內容理解
多模態推理

使用案例

文檔處理
文檔問答
從掃描文檔或PDF中提取信息並回答問題
在DocVQA測試集上達到88.0分
視覺問答
圖像內容問答
回答關於圖像內容的複雜問題
在TextVQA驗證集上達到79.1分
教育輔助
圖表理解
解釋和分析各種圖表數據
在ChartQA測試集上達到82.0分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase