Bullinger General Model
该模型是基于TrOCR架构的手写文本识别模型,专门针对16世纪布林格书信集进行微调训练,适用于历史手写文档的数字化处理。
下载量 49
发布时间 : 8/31/2023
模型简介
本模型专注于手写文本识别任务,特别优化用于处理16世纪宗教改革时期布林格书信集中的拉丁语和德语手写体文本。
模型特点
历史手写体优化
专门针对16世纪手写体特征进行优化训练
多语言支持
可同时处理拉丁语和德语两种语言的手写文本
学术研究导向
模型训练和评估基于严谨的学术研究,有详细的文献支持
模型能力
手写文本识别
历史文档数字化
拉丁语OCR
德语OCR
使用案例
历史文献数字化
宗教改革文献转录
自动转录16世纪宗教改革时期的书信和文档
提高历史文献数字化的效率和准确性
档案馆藏数字化
用于博物馆和档案馆藏手写文献的批量处理
降低人工转录成本,加速文献数字化进程
学术研究
历史语言学分析
为历史语言学研究提供机器可读的文本数据
支持大规模文本分析和语料库建设
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98