E

Eagle2 9B

由KnutJaegersberg開發
Eagle2是一個高性能的視覺語言模型系列,專注於通過數據策略和訓練方法的優化來提升模型性能。Eagle2-9B是該系列中的大型模型,在性能和推理速度之間取得了良好平衡。
下載量 15
發布時間 : 1/23/2025

模型概述

Eagle2-9B是一個視覺語言模型(VLM),能夠處理圖像和文本輸入,生成文本輸出。它基於Qwen2.5-7B-Instruct語言模型和Siglip+ConvNext視覺模型構建,支持多語言和多模態任務。

模型特點

多模態能力
能夠同時處理圖像和文本輸入,理解視覺內容並生成相關文本
多語言支持
支持13種語言,包括中文、英語和多種其他主要語言
高性能
在多個基準測試中表現優異,特別是在文檔理解、圖表問答和信息提取任務上
長上下文支持
支持長達16K的上下文長度,適合處理複雜任務

模型能力

圖像理解
文本生成
多模態推理
文檔分析
圖表理解
視頻理解
多語言處理

使用案例

文檔處理
文檔問答
從文檔圖像中提取信息並回答問題
在DocVQA測試集上達到92.6分
視覺問答
圖表理解
理解和解釋圖表內容
在ChartQA測試集上達到86.4分
圖像問答
回答關於圖像內容的問題
在TextVQA驗證集上達到83.0分
多模態推理
數學視覺推理
解決需要視覺和數學推理的問題
在MathVista測試集上達到63.8分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase