V

Vietable Donut Docvqa Demo

Developed by YuukiAsuna
Donutモデルをベトナム語文書質問応答(表データ)向けに微調整したバージョン
Downloads 16
Release Time : 10/23/2024

Model Overview

このモデルはベトナム語表文書の質問応答タスク向けに最適化されたバージョンで、Donutアーキテクチャに基づき、OCR前処理なしで文書画像から直接情報を抽出できます。

Model Features

OCR前処理不要
文書画像を直接処理し、従来のOCRステップなしで文書内容を理解
ベトナム語表最適化
ベトナム語表データ向けに特別に微調整され、表理解能力を最適化
エンドツーエンド文書理解
Transformerアーキテクチャを採用したエンドツーエンドの文書視覚質問応答

Model Capabilities

表文書理解
視覚質問応答
ベトナム語テキスト抽出

Use Cases

文書処理
ベトナム語表データ検索
ベトナム語表文書から直接特定の質問を抽出して回答
表中の数値、日付などの構造化情報検索に正確に回答可能
ビジネス文書分析
ベトナム語財務報告書、請求書などのビジネス文書を処理
重要なビジネスデータを迅速に抽出可能
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase