F

Florence 2 FT DocVQA

sahilnishadによって開発
Florence-2-baseをファインチューニングした文書視覚QAモデルで、文書画像内のQAタスクを専門に処理します。
ダウンロード数 4,928
リリース時間 : 11/2/2024

モデル概要

このモデルはDocumentVQAデータセットでファインチューニングされており、文書画像の内容を理解し関連する質問に答えることができ、様々な文書分析シナリオに適用可能です。

モデル特徴

文書画像理解
文書画像の内容と構造を解析・理解可能
QA能力
文書内容に対して正確なQA機能を提供
マルチモーダル処理
視覚情報とテキスト情報を同時処理し、クロスモーダル理解を実現

モデル能力

文書画像分析
視覚QA
テキスト抽出
クロスモーダル理解

使用事例

文書処理
契約書分析
契約書から重要な条項と条件を抽出
請求書処理
請求書から金額、日付、仕入先情報を識別
教育
答案採点
学生の答案を自動採点し回答を抽出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase