G

GOT CPU

由srimanth-d開發
GOT-OCR2.0是一個多語言通用OCR模型,採用端到端架構實現先進的文本識別能力。
下載量 960
發布時間 : 9/24/2024

模型概述

該模型通過統一的端到端架構實現了OCR-2.0技術,支持多語言文本識別,結合了視覺語言處理能力,適用於各種文檔和場景文本識別任務。

模型特點

統一端到端架構
採用端到端模型設計,簡化了傳統OCR的多階段流程
多語言支持
能夠處理多種語言的文本識別任務
OCR-2.0技術
實現了新一代OCR技術,提供更準確的文本識別能力

模型能力

文檔文本識別
場景文本識別
多語言文本提取
圖像到文本轉換

使用案例

文檔數字化
紙質文檔OCR
將掃描或拍攝的紙質文檔轉換為可編輯文本
高精度的文本識別結果
場景文本識別
街景文字識別
識別街道標誌、廣告牌等場景中的文字
適應各種字體和背景的識別能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase