N

Ner Stacked Bert Multilingual Light

由impresso-project開發
Impresso NER模型是一個用於歷史文檔處理的多語言命名實體識別模型,基於堆疊式Transformer架構,能夠識別數字化歷史文本中的細粒度和粗粒度實體類型。
下載量 1,009
發布時間 : 5/16/2025

模型概述

該模型旨在識別歷史文檔中的命名實體,包括人物、組織、地點、時間和產品等,特別適用於處理OCR轉錄的歷史報紙內容。

模型特點

多語言支持
支持法語、德語和英語,適用於多語言歷史文本處理。
細粒度和粗粒度實體識別
能夠識別多種實體類型,包括人物、組織、產品、時間和地點等。
抗OCR噪聲
通過堆疊Transformer層,有效減輕歷史文檔中OCR噪聲、拼寫變化和非標準語言用法的影響。

模型能力

歷史文本命名實體識別
多語言實體識別
細粒度實體分類
抗OCR噪聲處理

使用案例

歷史信息提取
歷史檔案分析
從歷史報紙和檔案中提取人物、地點和時間等實體信息。
可用於重建歷史事件的時間線和人物關係網絡。
傳記重建
人物生平研究
從歷史文檔中提取人物姓名、頭銜和職能等信息。
有助於構建歷史人物的詳細傳記資料。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase