E

Eagle2 2B

由 nvidia 开发
Eagle2是NVIDIA推出的高性能视觉语言模型家族,专注于通过数据策略和训练方案提升开源视觉语言模型的性能。Eagle2-2B是该系列中的轻量级模型,在保持强劲性能的同时实现卓越效率和速度。
下载量 667
发布时间 : 1/10/2025

模型简介

Eagle2-2B是一个融合视觉和语言能力的多模态模型,能够处理图像、文本和视频输入,执行多种视觉语言任务。

模型特点

高效轻量
在2B参数规模下实现卓越的性能和速度平衡
多模态处理
支持图像、文本和视频输入的综合处理能力
长上下文支持
支持长达16K tokens的上下文长度
高性能基准
在多个视觉语言基准测试中表现优异

模型能力

图像理解与描述
视觉问答
文档理解
图表分析
视频内容理解
多模态推理

使用案例

文档处理
文档问答
从扫描文档或PDF中提取信息并回答问题
在DocVQA测试集上达到88.0分
视觉问答
图像内容问答
回答关于图像内容的复杂问题
在TextVQA验证集上达到79.1分
教育辅助
图表理解
解释和分析各种图表数据
在ChartQA测试集上达到82.0分
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase