D

DA BERT Old News V1

由CALDISS-AAU開發
首個基於丹麥專制時期(1660-1849年)歷史文本訓練的變壓器模型,由奧爾堡大學研究人員開發,用於處理與現代丹麥語差異較大的歷史文本語義。
下載量 48
發布時間 : 4/1/2025

模型概述

基於MLM任務預訓練的BERT模型,專門針對丹麥專制時期的歷史文本進行優化,能夠更好地理解和處理這些與現代丹麥語有顯著差異的文本。

模型特點

歷史文本優化
專門針對丹麥專制時期(1660-1849年)的歷史文本進行訓練,能夠更好地捕捉與現代丹麥語差異較大的語義。
定製分詞器
使用定製WordPiece分詞器,優化對歷史文本的分詞效果。
高質量訓練數據
訓練數據來自ENO語料庫,包含1762至1848年間丹麥與挪威報紙的新聞、公告及廣告,單詞級錯誤率約為5%。

模型能力

填充掩碼
歷史文本語義理解

使用案例

歷史研究
歷史文本分析
用於分析丹麥專制時期的歷史文本,幫助研究人員理解當時的語言使用和社會背景。
歷史文獻翻譯輔助
輔助翻譯歷史文獻,提供更準確的語義理解。
語言學
語言演變研究
用於研究丹麥語從專制時期到現代的演變過程。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase