court-records-htrオープンソースの手書き文字認識モデル - 19世紀のフィンランド語とスウェーデン語の法廷記録を無料で認識

ホーム

Court Records Htr

Kansallisarkistoによって開発

マイクロソフトTrOCRをファインチューニングした手書き文字認識モデルで、19世紀のフィンランド語とスウェーデン語の裁判記録文書に特化

文字認識

PyTorch

オープンソースライセンス:MIT #歴史手書き文字認識 #フィンランド語・スウェーデン語OCR #裁判記録のデジタル化

ダウンロード数 24

リリース時間 : 9/12/2024

モデル概要

このモデルはテキスト行画像から手書き文字を認識するために使用され、特に19世紀のフィンランド語とスウェーデン語のデジタル化された裁判記録文書向けに最適化されています。

モデル特徴

歴史文書向け最適化

19世紀の手書き文字の特徴に特化して訓練されており、歴史文書認識タスクで優れた性能を発揮

多言語対応

フィンランド語とスウェーデン語の手書き認識を同時にサポート

高精度認識

検証データセットで2.4%の文字誤り率と11.3%の単語誤り率を達成

モデル能力

手書き文字認識

歴史文書処理

多言語テキスト抽出

使用事例

歴史アーカイブのデジタル化

裁判記録の転写

19世紀の手書き裁判記録を検索可能なデジタルテキストに変換

高精度な自動転写を実現、文字誤り率はわずか2.4%

家系研究

歴史的人口記録処理

歴史的人口登録簿の手書き情報を自動認識

🚀 19世紀フィンランドの裁判記録の手書き文字認識

このモデルは、テキスト行画像から手書き文字を認識します。 MicrosoftのTrOCRモデルを、19世紀のデジタル化されたフィンランド語とスウェーデン語の裁判記録文書でファインチューニングすることで学習されました。

🚀 クイックスタート

このモデルは特定の19世紀のデータから手書き文字を認識するように学習されており、他のデータセットに対する汎化能力は低い可能性があります。また、入力としてテキスト行画像を受け取り、他のタイプの入力の使用は推奨されません。

✨ 主な機能

テキスト行画像からの手書き文字認識を行うことができます。

📦 インストール

このモデルはHuggingFace Hubからダウンロードできます。必要なライブラリをインストールすることで使用可能です。

💻 使用例

基本的な使用法

from transformers import TrOCRProcessor, VisionEncoderDecoderModel
from PIL import Image
import torch

# Use GPU if available
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# Model location in Huggingface Hub
model_checkpoint = "Kansallisarkisto/court-records-htr"
# Path to textline image
line_image_path = "/path/to/textline_image.jpg"

# Initialize processor and model
processor = TrOCRProcessor.from_pretrained(model_checkpoint)
model = VisionEncoderDecoderModel.from_pretrained(model_checkpoint).to(device)

# Open image file and extract pixel values
image = Image.open(line_image_path).convert("RGB")
pixel_values = processor(image, return_tensors="pt").pixel_values

# Use the model to generate predictions 
generated_ids = model.generate(pixel_values.to(device))
# Use the processor to decode ids to text
generated_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(generated_text)