G

GOT CPU

Developed by srimanth-d
GOT-OCR2.0は多言語対応の汎用OCRモデルで、エンドツーエンドアーキテクチャにより先進的なテキスト認識能力を実現しています。
Downloads 960
Release Time : 9/24/2024

Model Overview

このモデルは統一されたエンドツーエンドアーキテクチャによりOCR-2.0技術を実現し、多言語テキスト認識をサポート、視覚言語処理能力を組み合わせ、様々なドキュメントやシーンテキスト認識タスクに適しています。

Model Features

統一エンドツーエンドアーキテクチャ
エンドツーエンドモデル設計を採用し、従来のOCRの多段階プロセスを簡素化
多言語サポート
複数言語のテキスト認識タスクを処理可能
OCR-2.0技術
次世代OCR技術を実現し、より正確なテキスト認識能力を提供

Model Capabilities

ドキュメントテキスト認識
シーンテキスト認識
多言語テキスト抽出
画像からテキストへの変換

Use Cases

ドキュメントデジタル化
紙文書OCR
スキャンまたは撮影した紙文書を編集可能なテキストに変換
高精度なテキスト認識結果
シーンテキスト認識
街中の文字認識
道路標識、看板などのシーン中の文字を認識
様々なフォントや背景に対応した認識能力
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase