P

Perseus Doc Vl 071225 I1 GGUF

由mradermacher開發
Perseus-Doc-vl-0712 是一個支持英文和中文的視覺語言模型,適用於文本生成推理、圖像字幕生成和光學字符識別等多種任務。
下載量 322
發布時間 : 7/13/2025

模型概述

該模型是一個多功能的視覺語言模型,能夠處理文檔分析、圖像理解和文本生成等任務,特別適用於文檔處理和視覺內容理解場景。

模型特點

多語言支持
同時支持英文和中文處理,適用於雙語環境。
多任務能力
能夠執行文本生成、圖像字幕生成和OCR等多種任務。
量化選項豐富
提供多種量化版本,適應不同硬件資源需求。

模型能力

文本生成
圖像字幕生成
光學字符識別
智能字符識別
文檔視覺理解
圖像到文本轉換

使用案例

文檔處理
PDF文檔分析
從PDF文檔中提取和分析文本內容
文檔OCR
識別掃描文檔中的文字內容
圖像理解
圖像字幕生成
為圖像生成描述性文字
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase