N

Ner Stacked Bert Multilingual Light

由 impresso-project 开发
Impresso NER模型是一个用于历史文档处理的多语言命名实体识别模型,基于堆叠式Transformer架构,能够识别数字化历史文本中的细粒度和粗粒度实体类型。
下载量 1,009
发布时间 : 5/16/2025

模型简介

该模型旨在识别历史文档中的命名实体,包括人物、组织、地点、时间和产品等,特别适用于处理OCR转录的历史报纸内容。

模型特点

多语言支持
支持法语、德语和英语,适用于多语言历史文本处理。
细粒度和粗粒度实体识别
能够识别多种实体类型,包括人物、组织、产品、时间和地点等。
抗OCR噪声
通过堆叠Transformer层,有效减轻历史文档中OCR噪声、拼写变化和非标准语言用法的影响。

模型能力

历史文本命名实体识别
多语言实体识别
细粒度实体分类
抗OCR噪声处理

使用案例

历史信息提取
历史档案分析
从历史报纸和档案中提取人物、地点和时间等实体信息。
可用于重建历史事件的时间线和人物关系网络。
传记重建
人物生平研究
从历史文档中提取人物姓名、头衔和职能等信息。
有助于构建历史人物的详细传记资料。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase