table - detection - and - extractionオープンソースの表検出モデル - 画像内の枠付きおよび枠なしの表を高精度で識別

ホーム

Table Detection And Extraction

foduucomによって開発

YOLOv8sベースのテーブル検出モデルで、画像内のボーダー付き・ボーダーレステーブルを正確に識別可能

物体検出

TensorBoard

英語#高精度テーブル検出 #ボーダーレステーブル認識 #ドキュメントOCR統合

ダウンロード数 55.45k

リリース時間 : 8/5/2023

モデル概要

このモデルは画像内のテーブル検出専用に設計されており、ボーダーの有無を問わず検出可能。大規模データセットで微調整され、テーブル検出とボーダー有無の識別において高い精度を実現

モデル特徴

高精度テーブル検出

モデルはテーブル検出においてmAP@0.5で0.962の精度を達成し、ボーダー付き・ボーダーレステーブルを効果的に識別可能

非構造化ドキュメント処理

複雑な非構造化ドキュメント内のテーブルを処理可能で、バウンディングボックス技術によりテーブル領域を分離

OCR統合機能

OCR技術とシームレスに統合可能で、テーブル位置の検出だけでなくテーブル内テキストデータの抽出も可能

多様なテーブル認識

様々なデザインやスタイルのテーブルを認識可能で、異なるドキュメントレイアウトに適応

モデル能力

テーブル検出

テーブル分類（ボーダー付き/ボーダーレス）

ドキュメント分析

非構造化テーブル抽出

構造化テーブル抽出

使用事例

ドキュメント処理

テーブルデータ抽出

スキャン文書や画像からテーブルデータを抽出

OCR技術と組み合わせてテーブルデータの自動抽出を実現

ドキュメント分析

ドキュメント内のテーブルレイアウトと構造を分析

ドキュメント内容と組織構造の理解を支援

データ管理

非構造化データ変換

非構造化ドキュメント内のテーブルを構造化データに変換

後のデータ分析と処理を容易にする

🚀 YOLOv8s テーブル検出モデル

このYOLOv8sテーブル検出モデルは、YOLO（You Only Look Once）フレームワークに基づく物体検出モデルです。画像内の境界付きまたは境界なしのテーブルを検出することができ、大規模なデータセットでファインチューニングされており、高い精度を達成しています。

🚀 クイックスタート

このモデルを使用するには、以下の手順に従ってください。

インストール

pip install ultralyticsplus==0.0.28 ultralytics==8.0.43

モデルのロードと予測の実行

from ultralyticsplus import YOLO, render_result

# モデルのロード
model = YOLO('foduucom/table-detection-and-extraction')

# モデルのパラメータ設定
model.overrides['conf'] = 0.25  # NMSの信頼度閾値
model.overrides['iou'] = 0.45  # NMSのIoU閾値
model.overrides['agnostic_nms'] = False  # NMSのクラス非依存性
model.overrides['max_det'] = 1000  # 画像あたりの最大検出数

# 画像の設定
image = '/path/to/your/document/images'

# 推論の実行
results = model.predict(image)

# 結果の表示
print(results[0].boxes)
render = render_result(model=model, image=image, result=results[0])
render.show()

✨ 主な機能

画像内の境界付きまたは境界なしのテーブルを高精度に検出します。
光学文字認識（OCR）技術との統合により、テーブル内のデータを抽出することができます。
非構造化文書の解析に役立ち、テーブルの検出とデータ抽出を効率化します。

📚 ドキュメント

モデルの詳細

モデルの説明

YOLOv8sテーブル検出モデルは、画像内のテーブルを正確に識別するための汎用的なソリューションです。境界付きまたは境界なしのテーブルを検出するだけでなく、非構造化文書の複雑さに対応することができます。バウンディングボックスの描画などの高度な技術を使用して、ユーザーは視覚コンテンツ内の関心のあるテーブルを分離することができます。

このモデルの特長は、光学文字認識（OCR）技術とのシームレスな統合です。これにより、モデルはテーブルを検出するだけでなく、テーブル内に含まれる関連データを抽出することができます。バウンディングボックスの情報を使用してテーブルを切り抜き、OCRと組み合わせてテキストデータを精密に抽出することで、非構造化文書からの情報検索プロセスを合理化します。

開発者: FODUU AI
モデルの種類: 物体検出
タスク: テーブル検出（境界付きおよび境界なし）

サポートされるラベル

['bordered', 'borderless']

用途

直接的な使用

このモデルは、画像内の境界付きまたは境界なしのテーブルを検出するために直接使用することができます。また、これらの2つのカテゴリを区別する能力も備えています。

下流の使用

このモデルは、特定のテーブル検出タスクのためにファインチューニングすることもできますし、家具認識、インテリアデザイン、画像ベースのデータ抽出などの大規模なアプリケーションに統合することもできます。

範囲外の使用

このモデルは、テーブル検出の範囲外の無関係な物体検出タスクやシナリオには設計されていません。

バイアス、リスク、および制限

このモデルにはいくつかの制限とバイアスがある可能性があります。

パフォーマンスは、トレーニングデータの品質、多様性、および代表性によって異なる場合があります。
複雑なデザインや配置のテーブルの検出には困難を伴う場合があります。
照明条件、画像品質、および解像度の変動によって精度が影響を受ける可能性があります。
非常に小さいまたは遠くのテーブルの検出精度は低くなる可能性があります。
境界付きと境界なしのテーブルの分類能力は、デザインの変動によって影響を受ける可能性があります。

推奨事項

ユーザーは、このモデルの制限と潜在的なバイアスについて十分に理解する必要があります。特定の使用ケースについては、さらなるテストと検証を行い、パフォーマンスを正確に評価することをお勧めします。

🔧 技術詳細

トレーニングデータ

このモデルは、さまざまなソースから収集されたテーブルの画像を含む多様なデータセットでトレーニングされています。データセットには、境界付きと境界なしの両方のテーブルの例が含まれており、さまざまなデザインやスタイルをカバーしています。

トレーニング手順

トレーニングプロセスには大量の計算が必要であり、複数のエポックにわたって行われます。モデルの重みは、検出損失を最小化し、パフォーマンスを最適化するために調整されます。

評価指標

mAP@0.5 (box):
- 全体: 0.962
- 境界付き: 0.961
- 境界なし: 0.963

モデルアーキテクチャと目的

YOLOv8sアーキテクチャは、修正されたCSPDarknet53をバックボーンとして使用し、自己注意機構と特徴ピラミッドネットワークを備えています。これらのコンポーネントは、サイズ、デザイン、およびスタイルの変動を考慮して、テーブルを正確に検出および分類するモデルの能力に貢献しています。

コンピュートインフラストラクチャ

ハードウェア

NVIDIA GeForce RTX 3060カード

ソフトウェア

このモデルは、Jupyter Notebook環境を使用してトレーニングおよびファインチューニングされました。

📄 ライセンス

詳細なライセンス情報は提供されていません。

モデルカードの問い合わせ

質問や貢献については、info@foduu.comまでお問い合わせください。

@ModelCard{
  author    = {Nehul Agrawal and
               Pranjal Singh Thakur},
  title     = {YOLOv8s Table Detection},
  year      = {2023}
}

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご