T

Typhoon Ocr 7b

由scb10x開發
專為泰英雙語現實場景文檔解析打造的視覺語言模型,基於Qwen2.5-VL-Instruction框架
下載量 126
發布時間 : 5/14/2025

模型概述

專注於泰英雙語文檔的OCR識別與結構化解析,支持複雜版式文檔處理和多層視覺分析

模型特點

泰英雙語支持
專門優化泰語和英語混合文檔的識別能力
複雜文檔解析
能處理財務報表、政府表格等結構化文檔以及收據、菜單等版式複雜文檔
多層視覺分析
支持元素識別、上下文分析、文本提取、藝術結構分析和綜合摘要生成
結構化輸出
輸出支持Markdown、HTML表格和<figure>標籤,保持原始文檔結構

模型能力

泰英雙語OCR識別
文檔結構化解析
表格數據提取
圖表分析
多語言混合內容處理
複雜版式文檔理解

使用案例

金融文檔處理
財務報表解析
從複雜的財務報表中提取結構化數據
超越GPT-4o和Gemini 2.5 Flash的性能
政府文件處理
政府表格解析
自動識別和提取政府表格中的關鍵信息
高精度結構化輸出
教育資料處理
學術論文解析
提取論文中的文本、圖表和參考文獻信息
支持Markdown和HTML格式輸出
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase