N

Ner Stacked Bert Multilingual Light

Developed by impresso-project
Impresso NER模型是一個用於歷史文檔處理的多語言命名實體識別模型,基於堆疊式Transformer架構,能夠識別數字化歷史文本中的細粒度和粗粒度實體類型。
Downloads 1,009
Release Time : 5/16/2025

Model Overview

該模型旨在識別歷史文檔中的命名實體,包括人物、組織、地點、時間和產品等,特別適用於處理OCR轉錄的歷史報紙內容。

Model Features

多語言支持
支持法語、德語和英語,適用於多語言歷史文本處理。
細粒度和粗粒度實體識別
能夠識別多種實體類型,包括人物、組織、產品、時間和地點等。
抗OCR噪聲
通過堆疊Transformer層,有效減輕歷史文檔中OCR噪聲、拼寫變化和非標準語言用法的影響。

Model Capabilities

歷史文本命名實體識別
多語言實體識別
細粒度實體分類
抗OCR噪聲處理

Use Cases

歷史信息提取
歷史檔案分析
從歷史報紙和檔案中提取人物、地點和時間等實體信息。
可用於重建歷史事件的時間線和人物關係網絡。
傳記重建
人物生平研究
從歷史文檔中提取人物姓名、頭銜和職能等信息。
有助於構建歷史人物的詳細傳記資料。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase