B

Bros Base Uncased

jinho8345によって開発
BROSは、テキストとレイアウトに特化した事前学習言語モデルで、文書から効率的に重要情報を抽出できます。
ダウンロード数 740
リリース時間 : 9/19/2023

モデル概要

BROS(BERT Relying On Spatiality)は、テキストとレイアウトに特化した事前学習言語モデルで、文書からより良く重要情報を抽出することを目的としています。文書画像のOCR結果(テキストとバウンディングボックスのペア)が与えられると、レシートからの順序付き項目リストの抽出など、様々な重要情報抽出タスクを実行できます。

モデル特徴

空間認識能力
モデルは、文書内のテキストの空間レイアウト情報を理解でき、重要情報抽出の精度を向上させます。
事前学習の優位性
大規模な事前学習により、モデルは豊富なテキストとレイアウトの特徴を学習しました。
OCR結果の処理
OCR出力のテキストとバウンディングボックスのペアを直接処理でき、追加の前処理は必要ありません。

モデル能力

文書の重要情報抽出
テキストとレイアウトの理解
レシート情報の構造化

使用事例

文書処理
レシート情報の抽出
レシートから順序付きの項目リストと価格情報を抽出します。
レシート内の商品名、数量、価格を構造化出力します。
表情報の抽出
文書の表から構造化データを抽出します。
表の内容を編集可能な構造化形式に変換します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase