T

Tablecell Htr

由Kansallisarkisto開發
該模型用於從表格單元格的文本行圖像中識別手寫文本,特別適用於20世紀30年代芬蘭死亡記錄和人口普查記錄中的手寫文本識別。
下載量 39
發布時間 : 9/12/2024

模型概述

通過對芬蘭國家檔案館的多世紀手寫文本識別模型和微軟的TrOCR模型進行微調訓練而成,專門用於識別特定類型表格單元格中的手寫文本。

模型特點

特定領域優化
專門針對歷史文檔表格單元格中的手寫文本進行優化,識別精度高
基於TrOCR架構
利用微軟TrOCR模型的強大能力,結合領域特定數據進行微調
GPU加速支持
支持GPU加速推理,提高處理速度

模型能力

手寫文本識別
表格單元格內容提取
歷史文檔數字化

使用案例

檔案數字化
歷史人口記錄轉錄
將20世紀30年代芬蘭人口普查記錄中的手寫內容轉換為可搜索的文本
驗證CER為0.107,WER為0.237
死亡記錄數字化
自動識別和轉錄歷史死亡記錄表格中的手寫信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase