B

Binarization Segformer B3

DiTo97によって開発
SegFormer-B3アーキテクチャをファインチューニングした文書画像二値化モデルで、DIBCO評価指標で優れた性能を発揮
ダウンロード数 85
リリース時間 : 5/13/2023

モデル概要

このモデルはセマンティックセグメンテーションモデルを文書画像二値化(DIBCO)問題に応用した研究で、ニューラルネットワークで古典的二値化アルゴリズムを改良する現在のトレンドとは異なるアプローチ

モデル特徴

高性能二値化
DIBCO評価指標でF値0.9840の優れた成績を達成
革新的手法
純粋なセマンティックセグメンテーションモデルで文書二値化問題を解決、主流の伝統的アルゴリズム改良アプローチとは異なる
マルチデータセット訓練
SauvolaNetと同じ13のデータセット組み合わせで訓練

モデル能力

文書画像処理
画像二値化
セマンティックセグメンテーション

使用事例

文書デジタル化
歴史的文書修復
古いまたは損傷した文書画像を鮮明化処理
文書の可読性向上、F値0.9840を達成
OCR前処理
OCRシステムに最適化された二値化入力を提供
後続の文字認識精度向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase