P

Perseus Doc Vl 071225 GGUF

由 mradermacher 开发
Perseus-Doc-vl-0712量化模型是一个支持文本生成推理、图像字幕生成、光学字符识别等多领域应用的视觉与语言理解模型,基于transformers库构建。
下载量 227
发布时间 : 7/13/2025

模型简介

该模型是prithivMLmods/Perseus-Doc-vl-0712的静态量化版本,支持多种视觉与语言理解任务,包括文本生成、图像字幕生成和光学字符识别等。

模型特点

多领域应用
支持文本生成推理、图像字幕生成、光学字符识别等多种任务。
多语言支持
能够处理英语和中文等多种语言。
量化版本
提供多种量化版本,适用于不同硬件和性能需求。

模型能力

文本生成推理
图像字幕生成
光学字符识别
智能字符识别
视觉理解
图像到文本转换

使用案例

文档处理
PDF文档分析
对PDF文档进行内容分析和识别。
OCR识别
从图像或扫描文档中提取文本内容。
图像理解
图像字幕生成
为图像生成描述性字幕。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase