trocr-medieval-castilian-hybrida Open-source Model - Accurately Identify Medieval Castilian Hybrida Handwriting

Trocr Medieval Castilian Hybrida

Developed by medieval-data

This is a TrOCR model specifically fine-tuned for medieval Castilian (particularly Hybrida handwriting), based on microsoft/trocr-base-handwritten.

Text Recognition

Transformers

OtherOpen Source License:MIT #Medieval handwriting recognition #Castilian OCR #Hybrida font analysis

Downloads 33

Release Time : 7/3/2024

Model Overview

This model is specialized for recognizing medieval Castilian Hybrida handwriting, serving as an application model in the Optical Character Recognition (OCR) field.

Model Features

Optimized for medieval handwriting

Specially fine-tuned for medieval Castilian Hybrida handwriting

Multi-stage training

First fine-tuned on Caroline font, then further fine-tuned on Hybrida font

Based on TrOCR architecture

Built upon the microsoft/trocr-base-handwritten foundation model

Model Capabilities

Medieval handwriting recognition

Image-to-text conversion

Latin script recognition

Use Cases

Historical document digitization

Medieval manuscript transcription

Convert medieval Castilian handwritten documents into editable text

Academic research

Paleography studies

Assist in researching the evolution and characteristics of Hybrida handwriting

🚀 TroCR Model for Medieval Castilian (Hybrida Script)

This is a TrOCR model designed for medieval Castilian, specifically tailored to the Hybrida script. It aims to address the challenges of optical character recognition in this specific historical context, providing valuable assistance in digitizing and analyzing medieval Castilian texts.

🚀 Quick Start

This is a TrOCR model for medieval Castilian, specifically the Hybrida script. The base model was microsoft/trocr-base-handwritten. The model was then finetuned to Caroline: medieval-data/trocr-medieval-latin-caroline. From a saved checkpoint, the model was further finetuned to Castilian Hybrida.

The dataset used for training was CATMuS.

The model has not been formally tested. Preliminary examination indicates that further finetuning is needed.

Finetuning was done with finetune.py found in this repository.

💻 Usage Examples

Basic Usage

from transformers import TrOCRProcessor, VisionEncoderDecoderModel
from PIL import Image
import requests

# load image from the IAM database
url = 'https://huggingface.co/medieval-data/trocr-medieval-castilian-hybrida/resolve/main/images/hybrida-1.png'
image = Image.open(requests.get(url, stream=True).raw).convert("RGB")

processor = TrOCRProcessor.from_pretrained('medieval-data/trocr-medieval-castilian-hybrida')
model = VisionEncoderDecoderModel.from_pretrained('medieval-data/trocr-medieval-castilian-hybrida')
pixel_values = processor(images=image, return_tensors="pt").pixel_values

generated_ids = model.generate(pixel_values)
generated_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]

📚 Documentation

BibTeX entry and citation info

TrOCR Paper

@misc{li2021trocr,
      title={TrOCR: Transformer-based Optical Character Recognition with Pre-trained Models}, 
      author={Minghao Li and Tengchao Lv and Lei Cui and Yijuan Lu and Dinei Florencio and Cha Zhang and Zhoujun Li and Furu Wei},
      year={2021},
      eprint={2109.10282},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

CATMuS Paper

@unpublished{clerice:hal-04453952,
  TITLE = {{CATMuS Medieval: A multilingual large-scale cross-century dataset in Latin script for handwritten text recognition and beyond}},
  AUTHOR = {Cl{\'e}rice, Thibault and Pinche, Ariane and Vlachou-Efstathiou, Malamatenia and Chagu{\'e}, Alix and Camps, Jean-Baptiste and Gille-Levenson, Matthias and Brisville-Fertin, Olivier and Fischer, Franz and Gervers, Michaels and Boutreux, Agn{\`e}s and Manton, Avery and Gabay, Simon and O'Connor, Patricia and Haverals, Wouter and Kestemont, Mike and Vandyck, Caroline and Kiessling, Benjamin},
  URL = {https://inria.hal.science/hal-04453952},
  NOTE = {working paper or preprint},
  YEAR = {2024},
  MONTH = Feb,
  KEYWORDS = {Historical sources ; medieval manuscripts ; Latin scripts ; benchmarking dataset ; multilingual ; handwritten text recognition},
  PDF = {https://inria.hal.science/hal-04453952/file/ICDAR24___CATMUS_Medieval-1.pdf},
  HAL_ID = {hal-04453952},
  HAL_VERSION = {v1},
}

📄 License

This project is licensed under the MIT license.

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご