T

Trocr Medieval Base

由medieval-data開發
這是一個針對中世紀手稿的TrOCR模型,基於microsoft/trocr-base-handwritten微調,專注於拉丁語、法語和西班牙語的中世紀手寫文本識別。
下載量 153
發布時間 : 7/8/2024

模型概述

該模型用於識別中世紀手稿中的文字,支持多種中世紀書寫體,如卡羅琳體、哥特體等。

模型特點

多字體支持
能夠識別多種中世紀書寫體,包括卡羅琳體、哥特體、半哥特體、混合體等。
多語言支持
支持拉丁語、法語和西班牙語的中世紀文本識別。
基於TrOCR架構
利用Transformer架構進行光學字符識別,具有較好的文本識別能力。

模型能力

中世紀手寫文本識別
多字體文本識別
多語言文本識別

使用案例

歷史文獻數字化
中世紀手稿轉錄
將中世紀手稿圖像轉換為可編輯的文本格式
字符錯誤率(CER)為0.035
學術研究
歷史文獻分析
幫助歷史學家和語言學家分析中世紀文本內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase