P

Perseus Doc Vl 071225 I1 GGUF

由 mradermacher 开发
Perseus-Doc-vl-0712 是一个支持英文和中文的视觉语言模型,适用于文本生成推理、图像字幕生成和光学字符识别等多种任务。
下载量 322
发布时间 : 7/13/2025

模型简介

该模型是一个多功能的视觉语言模型,能够处理文档分析、图像理解和文本生成等任务,特别适用于文档处理和视觉内容理解场景。

模型特点

多语言支持
同时支持英文和中文处理,适用于双语环境。
多任务能力
能够执行文本生成、图像字幕生成和OCR等多种任务。
量化选项丰富
提供多种量化版本,适应不同硬件资源需求。

模型能力

文本生成
图像字幕生成
光学字符识别
智能字符识别
文档视觉理解
图像到文本转换

使用案例

文档处理
PDF文档分析
从PDF文档中提取和分析文本内容
文档OCR
识别扫描文档中的文字内容
图像理解
图像字幕生成
为图像生成描述性文字
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase