E

Eagle X4 8B Plus

由 NVEagle 开发
Eagle是一个以视觉为中心的高分辨率多模态大语言模型家族,通过融合多种视觉编码器和不同输入分辨率,增强了多模态大语言模型的感知能力。
下载量 1,699
发布时间 : 9/7/2024

模型简介

Eagle是一个专注于视觉的高分辨率多模态大语言模型,支持超过1K的输入分辨率,在光学字符识别和文档理解等对分辨率敏感的任务上表现优异。

模型特点

多模态融合
采用基于通道拼接的'CLIP+X'融合方式,结合不同架构和知识的视觉专家。
高分辨率支持
支持超过1K的输入分辨率,在对分辨率敏感的任务上表现突出。

模型能力

图像理解
文本生成
光学字符识别
文档理解

使用案例

文档处理
文档内容理解
解析和理解高分辨率文档中的内容和结构
在多模态大语言模型基准测试中取得优异成绩
图像分析
高分辨率图像描述
生成高分辨率图像的详细描述
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase